We often see students who have a great deal of knowledge about the language on the theoretical level, but are unable to use it idiomatically, in a way native speakers can do. Instructors teaching a foreign language are regularly asked how words co-occur. Our goal is to create a technological solution that answer these questions and revolutionizes learning of a foreign language (Russian in the case). The primary focus is on providing web-based tools that stimulates active, participatory learning as opposed to more traditional ways of absorptive learning, which result in accumulation of passive knowledge. We refer to our target mode of learning as “inter-active learning” in this context. In particular, the CoCoCo project encompasses several directions:
utilizing large-scale annotated corpora;
analysis word co-occurrences using statistic methods and corpus-driven approach;
building user-friendly learning system that generates answers on demand.
This resource is developed by the research group based at the University of Helsinki. The CoCoCo project is partially financed by BAULT research community (University of Helsinki) and the Finnish National Agency for Education.
Group Leaders
Mikhail Kopotev, PhD, Assoc. Professor at the Department of Modern Languages, University of Helsinki
Andrei Shepelev, MA, research assistant at the Department of Modern Languages, University of Helsinki Roman Yangarber, PhD, researcher at the Department of Computer Science, University of Helsinki Daria Kormacheva, Doctoral student at the Department of Modern Languages, University of Helsinki Lidia Pivovarova, Doctoral student at the Department of Computer Science, University of Helsinki Eduard Klyshinsky, PhD, Associate Professor at the Department of Computer Science, Higher School of Economics, Moscow Maria Khokhlova, PhD, Associate Professor at Saint-Petersburg State University Matthew Pierce, Master student at the Department of Computer Science, University of Helsinki Andrey Kutuzov, Doctoral student at University of Oslo Elizaveta Kuzmenko, MA, Higher School of Economics, Moscow Natalia Kochetkova, Doctoral student at the Department of Computer Science, Higher School of Economics, Moscow Ekaterina Nironen, MA student at Helsinki Metropolia University of Applied Sciences Liubov Ivanova, MA, research assistant, Higher School of Economics, Moscow
Acknowledgements
We are grateful to the developers of the Russian National Corpus (especially E. Rakhilina and O. Lyashevskaya) and I-RU corpus (especially S. Sharoff) for providing us with the data. All rights to the original data belong to the holders.
О проекте
Часто студенты, имеющие большой объем знаний о грамматике и лексике изучаемого языка, не могут использовать его идиоматически, как это делают носители языка. Цель нашего проекта — создание нового технического средства обучения, которое решает как раз эту задачу: изучение сочетаемости слов. Основное внимание мы уделяем онлайн-сервису, который поощряет студентов к активному «исследованию» — к участию в процессе обучения, в отличие от более традиционного освоения языка через накопление пассивного знания. В этом контексте тип обучения, к которому мы стремимся, можно назвать «интерактивным». Проект CoCoCo основан на нескольких принципах:
использование больших аннотированных корпусов русского языка;
анализ сочетаний слов с использованием статистических методов (corpus-driven approach);
создание удобной системы обучения, генерирующей ответы на индивидуальные запросы.
Данный ресурс был разработан исследовательской группой на базе Хельсинкского университета. Проект частично финансируется исследовательской группой BAULT (Хельскинкский университет) и Национальным агентством образования Финляндии EDUFI (ранее CIMO).
Руководство
Михаил Копотев, PhD, адъюнкт-профессор Отделения современных языков, Хельсинкский университет
Андрей Шепелев, исследователь, научный сотрудник Отделения современных языков, Хельсинкский университет Роман Янгарбер, PhD, руководитель проектов Отделения компьютерных наук, Хельсинкский университет Дарья Кормачева, аспирант Отделения современных языков, Хельсинкский университет Лидия Пивоварова, аспирант Отделения информационных технологий, Хельсинкский университет Эдуард Клышинский, к.т.н., доцент департамента компьютерных исследований, Высшая школа экономики, Москва Мария Хохлова, к.ф.н., доцент Санкт-Петербургского государственного университета Андрей Кутузов, аспирант университета г. Осло Елизавета Кузьменко, магистр Высшей школы экономики, Москва Мэттью Пирс, магистрант Отделения информационных технологий, Хельсинкский университет Наталья Кочеткова, аспирант департамента компьютерных исследований, Высшая школа экономики, Москва Екатерина Ниронен, магистрант Helsinki Metropolia University of Applied Sciences Любовь Иванова, исследователь, магистр Высшей школы экономики, Москва
Благодарности
Мы весьма признательный разработчикам Национального корпуса русского языка (в особенности Е. Рахилиной и О. Ляшевской и корпуса I-RU (в особенности С. Шарову) за предоставленные нам данные. Все права на исходные данные принадлежат их владельцам.