Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа

Post on 20-Sep-2020

4 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

Transcript

Тема 7, 8: Работа с данни.

Представяне на резултатите

Петър Станков

petar.stankov@gmail.com

Изследователски методи

План на дискусията

1. Видове данни

2. Какви данни са подходящи за моята тема?

3. Организация на данните

4. Типични грешки при работа с данни

5. Проверка на хипотезата

6. Представяне на резултатите в таблици

7. Оформяне на изводите от анализа

8. Формулиране на мерки в икономическата политика

9. Написване на заключение и резюме

10. Разпространение на резултатите

1. Видове данни

Сечение: множество индивиди, фирми, държави, за които имаме данни само към определен момент от времето:

Yi = Ai + αX1i + βX2i +… +γXni + ɛi

Дълги редове: един отделен индивид/фирма /държава, данни за много периоди:

Yt = At + αX1t + βX2t +… +γXnt + ɛt

Панелни данни: множество индивиди, фирми, държави, за които имаме данни за множество периоди:

Yit = Ait + αX1it + βX2it +… +γXnit + ɛit

1. Видове данни:

примери

Сечение (+)

-лесно извеждане на корелации

- интуитивно извеждане на зависимости

Сечение (-)

- Сравнително малко наблюдения

- Резултатите нямат каузална интерпретация

Източник: Walliman (2011)

1. Видове данни:

примери

Времеви ред (+)

-лесно извеждане на корелации

- интуитивно извеждане на зависимости

Времеви ред (-)

-Резултатите често нямат каузална интерпретация

-Сравнително малко променливи

- често не може да се прилага МНМК, без да се преобразуват данните

1. Видове данни:

примериПанелни данни (+)

- Възможност за каузална интерпретация

- Възможност да се включат в модела ненаблюдаеми характеристики

Панелни данни (-)

-Методите за анализ са по-сложни

-Данните се събират по-трудно и по-рядко се намират неизследвани бази данни, ако са публично достъпни

2. Какви данни да използвам?• Използвайте сечение, ако:

– Изследвате връзки към даден момент от времето

– Правите международни сравнения с множество държави на един и същ обект (повече от 30, препоръчително над 100)

– Изследвате различни административни единици (области, общини, щати) в една и съща държава, но към даден момент от времето

• Използвайте времеви ред, ако:

– Ви е интересна само една държава или организация

– Въпросът ви засяга определено историческо развитие на две или повече променливи за тази държава

• Използвайте панел, ако:

– Целите резултатите ви да имат каузална интерпретация

– Целите моделите ви да имат висока обяснителна способност

– Се интересувате от историческо развитие на много места едновременно – потвърждаване и отхвърляне на теории?

3. Организиране на данните и

актуализация

• Голяма папка с данни (към папките с л-ра, резултатите и програмата (.do))

• По-малки папки с данни от различни източници и години

• Мастър файлове и работни файлове

• Добавяне на данни– Важност

– Как се прави (append или merge, в зависимост от това дали е панел или сечение)

• Чистене на данни

• Графично представяне на данни

4. Грешки при работа с данни

• При сечения:– Интерпретирам каузалност, вместо корелация

– Правя изводи за историята на даден процес

– Извеждам политически мерки въз основа на това как е работело нещо някъде другаде

• При времеви ред:– Интерпретирам каузалност без необходимата аргументация

– Не съм трансформирал данните си в подходящ за оценка вид: трябва да са “произволни променливи”; трябва да съм направил тестове за единичен корен

• При панелни данни:– Не включвам възможностите на панелните данни – фиксираните

ефекти, клъстеризиране на стандартните отклонения

• Обща грешка:– Не аргументирам защо моето X не е корелирано с грешките и защо

няма обратна каузалност между Y и X – тази аргументация е в основата на извеждането на каузалност (вместо на корелация)

– Опитвам се да максимизирам R2

5. Проверка на хипотезата

• 5.1. Да се върнем на модела. Как проверяваме дадена хипотеза?– Yit = Ait + αX1it + βX2it +… +γXnit + ɛit

– Ако α > 0 и е статистически значимо, то X1 се отразява положително на Y

– Какво става, ако α > 0, но не е статистически значимо?

– Извеждане на резултата от анализа: Икономическа интерпретация на α?

• 5.2. Повтаряме процедурата за всяко X, което ни интересува как влияе на Y

6. Оформяне на

резултатите в

таблици

-По редове: X

- По колони: Y

- Ако имате няколко

версии на модела – те се

дават в различни колони.

Напр., колона (1) дава

влияние на X1-Xk; колона

(2) дава влияние на X1-Xk ,

както и на допълнителни

променливи Xk+1-Xn

-- Таблицата в дясно

имаме едни и същи X, но

различни Y.

6.1. Задължителни атрибути на

таблиците с резултати

• Заглавие: какво изследваме

• X и Y – разбираеми

• Коефициенти, статистически значимости,

стандартни отклонения

• Брой наблюдения (държави / фирми /

потребители)

• R2 (или Adj. R2) – особено при МНМК

• Бележки: допълнителна информация

6.2. Написване на бележките към таблиците

-Максимално кратко и ясно: пояснения: какви променливи се използват

-Добре е да се даде дори уравнението, което се оценява

- Задълженително се дават статистическите значимости накрая

7. Формулиране на изводите от

анализа

• След частта с резултатите:

• Извеждат се повтарящи се зависимости

• Потвърждава ли се хипотезата?

• Вписват ли се резултатите от проверката на хипотезата в определено течение в литературата?– Намерихме ли допълнителни сведения за валидността

на определена теория?

– Опровергахме ли други теории?

• Какво ново научихме от тези резултати?

• Защо се получават тези резултати? (особено ако не са интуитивни)

8. Формулиране на мерки в

икономическата политика

• Имат ли значение моите резултати за определена политика?

• Ако не – за моето изследване политиката няма значение; изследването ми няма отношение към политиката

• Ако да – как може да се промени политиката (или мисленето за политиката) в следствие на моя анализ?

– Пример: изследване за плоския данък

• Необходимост от конкретика

9. Заключение и резюме (abstract)

• Какво направих?

• Как го направих?

• Защо го направих? (На кого служат изводите ми?)

• Потвърждава ли се основната ми хипотеза?

• Имам ли принос към литературата?

• Мога ли да изведа мерки в икономическата политика въз основа на проверката на хипотезата ми?

10. Разпространение на резултатите

1. Конференции

2. Работни доклади на определени организации (напр. финансиращи, или там, където сте провели изследването)

3. Публикации

1. Сборници от конференции

2. Монографии и книги

3. Списания без импакт фактор

4. Списания с импакт фактор

Още информация

Петър Станков

Каб. 4022, К-ра Икономикс, УНСС

petar.stankov@gmail.com

Уебсайт: http://home.cerge-

ei.cz/pstankov/teaching/resmf16.htm

Консултации: Сряда, 09:30-10:30; 15:00-18:00, след

предварителна уговорка по мейл.

СЕДМО Домашно: Произведете първата си таблица с

резултати. Напишете няколко страници коментари по нея,

като имате предвид през цялото време вашата основна

хипотеза. Направете извод накрая: Имате ли достатъчно

основание да потвърдите хипотезата си?

top related