Студентам о научно-исследовательской работе (краткое содержание)

Внимание! Более свежая версия этого текста находится здесь: MachineLearning.ru

Некоторые замечания и рекомендации для студентов Физтеха и ВМиК МГУ. Сразу предупреждаю: читать эти скрижали сразу и целиком не рекомендуется. Будет скучно. Читайте по мере необходимости. Перешли на следующий уровень — ознакомились с правилами игры.

Первый уровень: вы попали к нам на кафедру.

Второй уровень: присмотрелись, выбрали шефа, получили задачу.

Третий уровень: получили первые результаты и задание что-то написать.

Четвертый уровень: дело близится к защите.

Когда и с чего начинать, и что делать дальше

  1. На третьем курсе осенью (ВМиК МГУ) или весной (МФТИ) вы выбираете научного руководителя (шефа) и обсуждаете с ним тему будущей работы. Возможно, сначала вам придется решить несколько пробных задачек и/или разобраться с несколькими статьями, в том числе на английском. Затем вам будет дана основная задача, которая в перспективе должна перерасти в тему выпускной работы.
  2. Получив очередное задание, не стесняйтесь обратиться за дополнительными разъяснениями. Гораздо хуже, если вы надолго пропадете, так ничего и не сделав. Не бойтесь ошибиться, но бойтесь разлениться.
  3. Шеф имеет право быть занятым, не находить времени прочитать присланный вами материал в течение целой недели (двух, трех,...), очередной раз переносить встречу еще на неделю позже, и оказывать прочие знаки невнимания. Это нормально. Израсходуйте образовавшееся время на то, чтобы самостоятельно понять, что делать дальше, или заняться самообразованием. Когда вы все-таки встретитесь, обязательно поделитесь с шефом вашими соображениями; скажите: «Я вот тут прочитал такую-то статью и думаю, что можно воспользоваться этим методом» или «Я вот тут написал простенькую программку, и мне кажется, что ваша гипотеза не верна». Уверяю, шефу сразу станет с вами интересно, а заодно и стыдно, что он вас так запустил, и он, наконец, возьмется за ум.
  4. Как заниматься самообразованием, если про задачу вы узнали только вчера? Нет проблем! Ни один нормальный шеф не даст студенту тему, по которой в мире нет ни одной публикации. Не забывайте про поиск в Google или CiteSeer. Название теории, или алгоритма, или формулы, которые вы обсуждали с шефом — это уже ключевые слова для поиска. Сегодня в Интернете легко можно найти даже то, чего еще не знает ваш шеф.
  5. Математики обожают контрпримеры. Поэтому обсудим, как не надо делать. Сначала шеф дает вам простую задачу. Хороший студент, который активно работает, справляется с этой задачей быстро, получает усложнение, потом следующее, и т.д. К концу учебы набегают ощутимые результаты. Плохой студент приходит в конце семестра (года, последнего курса) и начинает решать поставленную, изначально простую, задачу. Практически невозможно за пару недель (и даже за пару месяцев) сделать нечто стоящее. Отсюда и берутся плохие, то есть слишком простые, выпускные работы.
  6. Самое время уточнить терминологию. Что я имею в виду, когда говорю тема, задача, задание, материал — это одно и то же или разные вещи? Раскладываю в порядке убывания объема:
  7. Чтобы вы не расслаблялись, деканаты придумали семестровые отчеты. Это называется зачет по НИРу (МФТИ) или спецсеминар (ВМиК МГУ). Каждый семестр ваша индивидуальная научная работа должна продвигаться еще немного вперед. Результат работы должен быть материален; это может быть программа, отчет, выполненные эксперименты. Просто придти в конце семестра и изложить ваши новые идеи — не достаточно, даже если они кажутся вам гениальными.
  8. Не могу говорить за других преподавателей, но лично я требую в каждом семестре отчета в письменной форме. В идеальном случае — если вы не будете менять тему исследования — эти отчеты, обрастая подробностями, постепенно перерастут в выпускную работу. Поэтому к этой деятельности относитесь серьезно. Отчет о научной работе (technical report) пишется в форме научной статьи, о чем будет рассказано ниже. Требования к научному содержанию отчетов будут возрастать от семестра к семестру, а требования к форме — оставаться неизменными.
  9. Еще один довод в пользу отчетов: в наше время обмен профессиональной информацией между людьми происходит преимущественно в электронном виде — отчеты, статьи, презентации, форумы. Всеми этими жанрами информационного обмена вам надо научиться владеть. Из них отчеты и статьи наиболее самодостаточны и требуют от автора наибольшей точности изложения.
  10. Редко кому удается решить поставленную задачу сходу. Поэтому самый первый семестровый отчет имеет право выглядеть скромно. Вполне достаточно, если он будет содержать только постановку задачи, рефераты прочитанных вами статей и/или результаты ваших первых экспериментов. Редко у кого получается написать все это с первого раза чисто да гладко. На то есть научный руководитель, чтобы поправить и направить.
  11. Поговорим о перспективах. Определитесь как можно раньше со своей будущей профессией. Если вы собираетесь остаться в науке (не важно — совмещая это с работой в фирме или нет), то вам необходимо иметь публикации и участвовать в конференциях уже к моменту поступления в аспирантуру. Это дополнительная нагрузка по сравнению с рядовым написанием выпускной работы. Да и сама работа в таком случае должна иметь уровень заметно выше среднего.
  12. Планировать свое участие в конференциях надо сильно заранее, т.к. сроки подачи статей (тезисов) обычно заканчиваются за несколько месяцев до начала конференции. В каких конференциях могут участвовать наши студенты:
  13. В аспирантуру берут не всех, а только тех, кто ведет реальную научную работу, и чьи шансы написать диссертацию на кафедре оцениваются высоко. Эта оценка складывается из целого набора формальных и неформальных критериев. Учитывается многое: успеваемость в течение всего периода обучения, сложность решенных в выпускной работе задач, способность генерировать идеи, самостоятельно ставить теоретические и/или прикладные задачи и правильно их решать, умение работать с литературой, проводить численные эксперименты, готовить публикации и выступления. Кафедра заинтересована в том, чтобы аспиранты защищались в срок. Поэтому людей с единственным мотивом (откосить от армии) в аспирантуру не берут.

Как планировать свое научное исследование

  1. Собственно, это не ваша забота — планировать вашу научную работу обязан шеф. Тем не менее, я считаю нужным объяснить студентам, по каким принципам я это делаю. Тогда мы будем лучше понимать друг друга.
  2. Планирование исследовательской работы во многом похоже на модульное программирование, с которым вы уже должны быть знакомы. Поняв постановку задачи, вы начинаете придумывать, на какие модули или классы удобно разбить проект. Изучаете готовые библиотеки, разбираетесь, какую полезную функциональность можно из них взять, чтобы не изобретать велосипед. Затем мысленно продумываете функции каждого модуля настолько детально, насколько это вообще возможно без программирования. Заботитесь о взаимозаменяемости модулей. На этом этапе вы находите наиболее серьезные проблемы и подводные камни, тем самым избегая многих будущих ошибок. Программируете упрощенную (пилотную) версию и убеждаетесь, что в общих чертах все работает. Если не работает, переписываете все заново. А когда заработает, углубляетесь в детали и заменяете заплатки более серьезным кодом. Не забываете про тестирование и документирование.

    Теперь проведем параллели.

  3. Изучение литературы. Изобретение велосипедов — это не наша специализация. Любое исследование базируется на каких-то уже известных результатах, и вы обязаны с ними ознакомиться, причем не просто заглянуть в рекомендованные шефом статьи, а внимательно их проработать, то есть понять в них все или почти все. С другой стороны, не надо фанатизма — если вы прочтете сразу все 150 статей, которые есть по вашей теме, то, скорее всего, парализуете вашу фантазию. Вам начнет казаться, что ничего нового тут изобрести невозможно. Лучшее, что вы сможете сделать — скомбинировать пару-тройку известных вариантов. Наилучший результат достигается, когда периоды собственного творчества чередуются с периодами глубокого изучения темы.
  4. Принцип модульности или проектирование «сверху-вниз». Есть такие задачи, которые поначалу кажутся необозримыми. Это нормально. Разобьем задачу на последовательность подзадач. Полезно продумать (вместе с шефом) возможные пути решения от начала до конца. А лучше несколько альтернативных путей. Какие методы понадобятся для решения каждой подзадачи? Насколько они стандартны, насколько эффективны? Какие из промежуточных задач могут быть решены несколькими способами? Согласно принципу взаимозаменяемости модулей сначала лучше реализовать наиболее простые решения, а потом искать оптимальные. Перед началом всей работы должно стать понятно, что ни на одном из промежуточных этапов не придется разрабатывать вечный двигатель. К моменту начала работы путь решения должен стать понятен в общих чертах, а ближайший этап — в деталях.
  5. От простого к сложному = от частного к общему. Есть такие задачи, которые кажутся неприступно сложными. Это тоже нормально. На первых порах можно по-разному упрощать постановку задачи, заниматься рассмотрением частных случаев (например, уменьшить размерность до 1 или 2, рассмотреть линейный случай). В математике часто случается так: задача успешно решается при некоторых безумных предположениях, но потом выясняется, что от них можно потихоньку отказаться, не сильно повредив решение. Или так: задача решается по-разному при двух по-своему безумных предположениях; но, глядя на оба решения, можно догадаться, как их «склеить» в одно вполне разумное решение. Вывод: если шеф дал задание исследовать какой-то дурацкий частный случай, еще рано делать вывод, что вам не повезло с шефом.
  6. От простого к сложному = от общего к частному. Некоторые задачи кажутся сложными из-за обилия частных подробностей и ограничений, связанных с конкретными приложениями. Иногда удается так обобщить задачу, что все ограничения приводятся к стандартному виду, и тогда она решается известными методами. Существует опасность обобщения: можно так обобщить, что задача станет неинтересной с прикладной точки зрения, хотя останется математически красивой. В науке известно немало примеров, когда для таких задач неожиданно обнаруживались совершенно новые приложения.
  7. А если задача поставлена не правильно и решить ее не удается? Тогда шеф делает ход, который обычно не укладывается в голове среднего студента — он меняет постановку задачи так, чтобы она все-таки решалась!
  8. Вычислительный эксперимент — это хороший способ генерации и тестирования идей. В нашей науке почти каждое исследование содержит элементы как теории, так и эксперимента. Во многих задачах с эксперимента стоит начинать. Для реализации можно пользоваться чем угодно — от C++ до MatLab, лишь бы вам это было удобно. Разрабатывайте экспериментальный модуль так, чтобы в нем можно было быстро менять условия эксперимента, сохранять результаты разных экспериментов, и потом их сопоставлять. Размышляйте над результатами — это дает новые идеи. Если у вас есть гипотеза, но вы не знаете, как ее доказать, попробуйте сначала убедиться экспериментально, что она верна. Уверенность исследователя в справедливости результата придает силы при поиске строгого доказательства. Подумайте над тем, какие промежуточные результаты, и в какой форме было бы интересно вывести. Глядя на них, часто удается заметить нечто такое, о чем раньше вы даже и не думали.
  9. Документирование. Почему-то мало кто любит сразу документировать свой код, записывать основные идеи прочитанных статей и оформлять свои результаты немедленно после их получения. Есть два разумных довода в пользу того, чтобы делать это сразу. Во-первых, пока вы помните все детали, сумеете сделать это лучше. Записать рано или поздно придется, но потом времени будет потрачено больше, и качество документа окажется ниже. Во-вторых, словесное формулирование приводит мысли в порядок и магическим образом повышает эффективность следующего этапа работы. К сожалению, этим советам редко кто следует. Понятно, почему — нехватку самодисциплины всегда можно свалить на нехватку времени. Итак,

Как писать научные статьи и отчеты

  1. Во всем мире научные статьи пишут по определенным канонам, выработанным столетиями. Но это отнюдь не дань традиции или навязанная кем-то игра. Сделав нечто полезное и нетривиальное, вы должны рассказать об этом так, чтобы люди смогли понять вас и при необходимости повторить и использовать ваши результаты, потратив минимум своего драгоценного времени.
  2. Более конкретно, научная статья преследует две цели:
  3. О том, как писать научные статьи (к отчетам и выпускным работам это тоже относится в полной мере), здорово рассказано в заметке Пэта Лэнгли Crafting Papers on Machine Learning. Обязательно прочитайте ее! Я многого не написал здесь, потому что об этом рассказал Пэт.
  4. Научная статья, как правило, имеет следующие разделы:
  5. Для оформления текста советую освоить издательскую систему TeX, с помощью которой цивилизованный мир пишет научные статьи и книги (нецивилизованный предпочитает MS Word, созданный для секретарш).

Некоторые приемы ясного изложения

    Наблюдение. Эталоном неясного изложения для нас будет «казенный язык» — скучный, неинтересный, трудно понимаемый, но при этом формально абсолютно корректный. Таким стилем пишутся инструкции. В советские времена в таком стиле писали газеты. Таким стилем все еще пишут некоторые ученые — но это неправильно.

  1. Фразы должны быть короткими. В каждой фразе должна быть ровно одна мысль.
  2. В русской фразе (кстати, как и в английской) самое важное слово, значимость которого хочется подчеркнуть особо, ставится последним. Обратите внимание на положение слов «особо» и «последним» в предыдущей фразе. Теперь ясно, что имеется в виду?

    Наблюдение. В «казенных» текстах фразы длинные, содержат по несколько мыслей, и наиболее значимое слово прячется в середине.

  3. Не надо пытаться сказать одну мысль несколькими разными способами. Нужно оставить только один, самый лучший, способ.

    Наблюдение. В гуманитарных текстах (например, в Библии) делается наоборот — одна и та же мысль повторяется многократно, но в разных формах. Чтобы каждый смог осознать ее в той форме, которая лично ему ближе. В техническом тексте нет необходимости украшать содержание разнообразием форм, так как его цель — передача знания, а не ощущения.

  4. Текст, содержащий формулы, должен оставаться в целом понятным, если его читать, просто пропуская все формулы. Это означает, что каждая формула должна сопровождаться комментарием, объясняющим ее содержательный смысл, или поясняющим, чем она интересна, или для чего она будет нужна в дальнейшем.

    Наблюдение. Математики делятся на две категории. «Алгебраисты» быстро понимают и хорошо запоминают формулы. «Геометры» предпочитают понимать содержательный смысл высказываний. Алгебраисты более формальны, геометры — более интуитивны. Кроме того, некоторые люди терпеть не могут формул, хоть и умные. Привыкайте заботиться о том, чтобы ваш текст дошел до максимально широких слоев профессионального сообщества.

  5. Любой термин или обозначение должны быть введены до первого использования, даже если они общеупотребительны. Это вроде бы очевидно, но по неопытности трудно уследить за каждой закорючкой.

    Наблюдение. В учебниках и хороших книгах таких грубых ошибок вы не найдете — благодаря тому, что эти тексты десятки раз вычитываются авторами, рецензентами и редакторами.

  6. Основные идеи текста должны быть в целом понятны, если целиком пропускать доказательства. Вывод: Если внутри доказательства спрятана важная идея, то ее обсуждение стоит вынести за пределы доказательства. Например, можно разбить доказательство на леммы.
  7. Формальное изложение (гипотезы, определения, леммы, теоремы, следствия) должно перемежаться неформальными объяснениями, интерпретациями, замечаниями, примерами, апеллирующими к интуиции и здравому смыслу.

    Наблюдение. Эпоха чисто формальных текстов в прикладной математике ушла в прошлое. Их понимание требует в несколько раз больших затрат времени. Темп жизни вырос, и если статью не удается понять за пару часов, то вернуться к ней уже не будет возможности. Однако любой результат можно изложить понятно. Этому можно и нужно научиться.

  8. Обычно все изложение делится на разделы, и каждый раздел, независимо от уровня и объема, строится по одному и тому же сценарию. В начале неформально объясняется постановка задачи и ее роль во всем исследовании (или в объемлющем разделе). В заключении неформально объясняется, что получилось, и как это интерпретировать. Средняя часть может быть целиком формальной. Важный принцип: изложение в целом должно быть понятным, если средние части во всех разделах целиком опустить.
  9. Каждая следующая фраза должна вытекать непосредственно из предыдущей. Слишком жестко? Ну, ладно, так и быть, хотя бы 95% фраз. Следить за линейной логикой изложения на порядок менее утомительно, чем за дробно-линейной.
  10. За точность смысла отвечают глаголы. Тщательный подбор одного единственного глагола иногда способен заменить пару строк простанных комментариев. Старайтесь не употреблять слишком абстрактных глаголов является, имеется, позволяет, поддерживает, применяется, и т.п. Это легкомысленная расточительность такого ценного ресурса, как глаголы. Ведь в каждой фразе глагол только один.

    Наблюдение. «Казенные» тексты напичканы абстрактными глаголами.

  11. Изложение должно быть структурировано, то есть разбито на блоки. Каждый блок должен решать более-менее обособленную задачу. Должно быть объявлено, зачем она решается, и почему она решается именно так. Чтобы ответить на вопрос «зачем», надо вспомнить общую цель всего исследования. Чтобы ответить на вопрос «почему так», надо сделать обзор литературы.

    Наблюдение. В маргинальных исследованиях вопросы «зачем» и «почему так» либо не ставятся, либо на них даются невнятные (неконкретные, слишком философские) ответы.

Как писать отзывы, рецензии, характеристики

  1. Отзыв научного руководителя. Цель этого документа — сказать то, что студент не скажет сам на защите. Во-первых, откуда взялась такая постановка задачи, и какое место она занимает в науке. Во-вторых, чем эта задача была сложна, и какой из результатов студента является наиболее весомым. В-третьих, какими личными качествами отличился студент в процессе выполнения работы. Если студент сделал существенно больше чем требовалось, успел поучаствовать в научных конференциях или проектах, об этом необходимо упомянуть. Это уже повод для рекомендации в аспирантуру. Последняя фраза подводит итог, например, так: «Работа удовлетворяет всем требованиям, предъявляемым к магистерским диссертациям, и заслуживает оценки отлично, а Фамилия И. О. — рекомендации в аспирантуру МФТИ.» Образец отзыва можно найти в этом архиве.
  2. Почему мы просим студентов самих написать отзыв?
  3. Рецензия. Цель этого документа — дать независимую экспертную оценку работы. Во-первых, рецензент должен продемонстрировать, что он работу читал. Поэтому краткому изложению работы посвящается от половины страницы до страницы текста. Во-вторых, он должен аргументированно выразить свое мнение о работе: отметить достоинства, указать на недостатки. В конце формулируется вывод. Образец отзыва — в том же архиве.
  4. Характеристика в аспирантуру. Этот документ похож на отзыв, но в нем меньше говорится о научной задаче, которую решал студент в своей выпускной работе, и больше говорится о качествах самого студента. Отмечается способность к самостоятельным исследованиям и решению достаточно сложных научных задач. Упоминаются публикации, участие в проектах и конференциях.

Как делать презентации на научных конференциях и защите

  1. Прошли те времена, когда выступать приходилось перед плакатом, нарисованным тушью в ночь перед защитой. Теперь в ночь перед защитой приходится делать презентацию.
    Сразу определитесь, что вы будете использовать: Кстати, в ночь перед защитой лучше все-таки хорошенько выспаться.
  2. Разделы презентации в целом должны повторять разделы самой работы: В отличие от самой работы, в коротком выступлении на защите (5–10 минут) надо сосредоточиться на постановке задачи и перечислении собственных результатов. Всем должно стать понятно: была какая-то сложная проблема, вы усердно поработали над ее решением, и что-то удалось улучшить. И только если вам отведено большее время, можно позволить себе поговорить о самом интересном — как именно вы решали задачу.
  3. Основные мысли доклада должны быть сформулированы на слайдах.
  4. Оптимальное число строк на слайде — от 5 до 9.
  5. На слайдах могут быть формулы, схемы, таблицы, графики. В коротком выступлении в них можно тыкать по ходу изложения, но при этом не надо останавливаться на мелочах и технических подробностях.
  6. Не читайте слайд дословно. Пусть все сложности останутся на слайдах, в устной речи излагайте только основные идеи, и как можно доходчивей.
  7. Не проговаривайте формулы словами — это долго и безумно скучно.

Как защищать выпускную квалификационную работу

  1. Выпускная работа — это научное исследование в миниатюре. Результат не обязан быть гениальным, хотя это приветствуется. Главное — самостоятельно и добросовестно пройти основные этапы типичного научного исследования: В нашей области большинство работ содержит элементы как теории, так и практики. Хотя, могут быть и чисто теоретические работы.
  2. Порассуждаем немного о пользе полезного. Как вы думаете, зачем нужно придерживаться всех этих формальностей: писать аннотацию, введение, заключение, и прочее, если сама задача уже успешно решена? Еще одно расхожее заблуждение: «зачем стараться, если все равно никто читать не будет». Неправда. Если хорошо написано, то читать будут. А набитая рука (и куски текста) пригодится для будущих работ. У большинства бакалавров впереди, как минимум, еще магистерская диссертация.
  3. Проверка орфографии, знание русской пунктуации и полиграфических традиций (см. LaTeX в примерах) также обязательно и входит в понятие «добросовестно сделанной работы». Не говоря уже об умении ясно изложить свои мысли.
  4. Введение лучше написать в последнюю очередь, когда основная работа уже сделана, и осталось только научиться об этом говорить по-человечески, а не на языке формул или языке C++. Если же введение писать, когда работа еще не готова, задача усложняется вдвойне. Ведь в конце вы поймете, что все получилось совсем не так, как планировалось в начале, и «тот старый бред» все равно придется переписывать.
  5. После того, как текст работы готов, пишется отзыв научного руководителя и рецензия. Де-факто рецензента выбирает научный руководитель. Согласно правилам это не может быть сотрудник той же кафедры. Отзыв и рецензия должны быть подписаны за две недели до защиты (для бакалавров рецензия не обязательна).
  6. К моменту подготовки выступления вы уже как минимум три раза написали краткое изложение своей работы. Поэтому вы уже уверены в себе. Тем не менее, рекомендую записать свою речь дословно (в четвертый раз!) и попробовать рассказать ее вслух с секундомером. Скорее всего, вас удивит, насколько сильно вы не укладываетесь в отведенные 5–7 минут.
    Внимание, раскрываю большой секрет: По объему это ровно одна страница печатного текста. И то, если не мямлить. Некоторым удается протараторить полторы страницы, но это уже искусство. Ни в коем случае не вдавайтесь в технические подробности! Как заметил однажды академик Журавлев, из 100 студентов только один не делает на защите эту самую распространенную ошибку. Основная задача вашего выступления — убедить комиссию, что ваша задача актуальна, сложна, и что вы придумали нечто новое, чтобы ее решить. Иными словами, что вы — квалифицированный специалист.