Top Banner
Я.Субботник, Санкт-Петербург, 3 декабря 2011 года Руководитель группы асессоров Ольга Мегорская Несколько интересных фактов об экспертной оценке
28

Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Jun 16, 2015

Download

Technology

Yandex

Ольга Мегорская "Несколько интересных фактов об экспертной оценке"
Я.Субботник в Санкт-Петербурге
О докладе:
Служба асессоров Яндекса – это развитая система сбора экспертных оценок. За время работы над ней мы узнали много интересного не только о качестве поиска Яндекса, но и о самих асессорах. В этот раз мы бы хотели поделиться с вами нашими наблюдениями. Мы расскажем о том, чем отличаются оценки оптимистов и пессимистов и чем вторые лучше первых; о том, что при попарном сравнении находятся «любители левого» и «любители правого»; о том, как можно автоматически выявить недобросовестного асессора, и еще о некоторых интересных фактах из области экспертной оценки.
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Я.Субботник, Санкт-Петербург, 3 декабря 2011 года

Руководитель группы асессоров Ольга Мегорская

Несколько интересных фактов об экспертной оценке

Page 2: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Экспертная оценка в Интернете

2

Page 3: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Где это используется? • Интернет-поиск

• Научные исследования

• Интернет-бизнес, в т.ч. спам

3

Page 4: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Асессоры Яндекса

• Релевантность: случайные запросы + документы к ним

• Относительные оценки

• Классификации и пр

4

Page 5: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

5

Абсолютная шкала: релевантность документов

Page 6: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

6

Абсолютная шкала: картинки/видео

Page 7: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

7

Попарное сравнение

Page 8: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Amazon Mechanical Turk CrowdSourcing

8

Page 9: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Amazon Mechanical Turk

9

Page 10: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Итак, факты!

10

Page 11: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

№1: Оптимисты VS Пессимисты

11

Page 12: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

• Оптимисты: когда сомневаются, завышают оценку

• Пессимисты: когда сомневаются, занижают оценку

• Негативные оценки - чаще верные

12

Page 13: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Пессимизм приходит с опытом

13

20,0%

30,0%

40,0%

50,0%

60,0%

70,0%

400 900 1300 1700 2100 2500 2900 2300 3700

Positive

Negative

Page 14: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

№2: Дороже – не значит лучше

14

Page 15: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

• Две стратегии: «сделать побольше, пока не выгнали» VS «аккуратная работа, долгое сотрудничество»

• Задания с высокой стоимостью привлекают первых

• Поэтому повышение стоимости задания может увеличить скорость его выполнения, но не повышает качество работы

15

Page 16: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

№3: Оценки сами говорят о своем качестве

16

Page 17: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

• Входной контроль

• Постпроверка случайной выборки заданий

• Предпроверенные задания («голденсет»)

• Ловушки

• Согласованность

• Распределение оценок

Контроль качества: ручной и автоматический

17

Page 18: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Сравнение «лучше/хуже/одинаково»

18

-1

0

1

1 2 3 4 5 6 7 8 9 10 11

Нормальный

-1

0

1

1 2 3 4 5 6 7 8 9 10 11

Хитрый

-1

0

1

1 2 3 4 5 6 7 8 9 10 11 12

Ленивый

Page 19: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

№4: Эксперты среди экспертов

19

Page 20: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Если нужны специальные знания, а их нет:

• Если человек плохо разбирается в теме, он склонен завышать оценку

• Релевантным кажется документ, который объясняет смысл запроса, а не отвечает на него

• Релевантность документа часть оценивают по наличию слов запроса

20

Page 21: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

[Фортепиано с нуля+нотная грамота](Москва)

21

Page 22: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

№5: Чего не могут эксперты

22

Page 23: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

23

Page 24: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Вакансия: писатель положительных отзывов

24

Page 25: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

• Используют больше превосходных степеней

• Меньше конкретных определений

• Избегают пространственных определений

• Чаще упоминают не относящиеся к самому объекту отзыва вещи

• Чаще упоминают первое лицо

25

Фальшивые отзывы

Page 26: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

• Towards Building a High-Quality Workforce with Mechanical Turk, 2010 PaulWais, Shivaram Lingamneni, Duncan Cook, Jason Fennell, Benjamin Goldenberg, Daniel Lubarov, David Marin, and Hari Simons Yelp, Inc

• An Analysis of Assessor Behavior in Crowdsourced Preference Judgments, 2010 Dongqing Zhu and Ben Carterette; Department of Computer & Information Sciences University of Delaware

• The Effect of Assessor Errors on IR System Evaluation, 2010 Ben Carterette, Dept. of Computer and Information Sciences University of Delaware; Ian Soboroff, National Institute of Standards and Technology, Gaithersburg, MD

• How evaluator domain expertise affects search result relevance judgments, 2007 Kenneth A. Kinney, Scott B. Huffman, and Juting Zhai. Google, Inc. Mountain View, CA

• Crowdsourcing Document Relevance Assessment with Mechanical Turk, 2010 Catherine Grady and Matthew Lease, School of Information, University of Texas at Austin

• Finding Deceptive Opinion Spam by Any Stretch of the Imagination, 2011 Myle Ott Yejin Choi Claire Cardie, Department of Computer Science, Cornell University; Jeffrey T. Hancock, Department of Communication, Cornell University

26

Ссылки

Page 27: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Спасибо!

27

Page 28: Ольга Мегорская "Несколько интересных фактов об экспертной оценке"

Руководитель группы асессоров

[email protected]

Ольга Мегорская