Ресурсы Интернета: Коллекция Goggle Books как объект литературоведческих исследований
Питер Леонард (Peter Leonard), докторант по скандинавистике Вашингтонского университета, и профессор Калифорнийского университета Тим Танджерлини (Tim Tangherlini) получили грант в размере 45 тыс. долларов от компании Google для создания инструментария по масштабному литературному анализу в рамках проекта Google Books. Это лишь часть тех средств, которые Интернет-гигант планирует выделить на поддержку исследований в области цифровых гуманитарных наук в ближайшие два года.
Поле деятельности Леонарда и Танджерлини – 160 тыс. текстов на шведском, датском и норвежском языках, входящих в состав коллекции Google Books в 12 млн. книг.
Питер Леонард, уроженец Беркли, штат Калифорния, занялся изучением скандинавских языков, будучи еще студентом Чикагского университета. До сегодняшнего дня он проводил исследования по современной шведской художественной литературе старым проверенным способом: подробно изучал и сравнивал книги. Теперь ему и его партнеру по проекту предстоит перейти от микроанализа к макроанализу, просматривая тысячи книг в поисках следов человеческой культуры и развития, чтобы понять, как думали и жили люди той или иной эпохи и национальности.
Например, можно будет спросить: «Какие прилагательные использовались для описания женского характера в романах 19 века? Какие слова использовались при описании природы?», - поясняет Леонардо. – «Можно будет найти интересную информацию о том, как люди рассказывали о каком-нибудь городе или стране. Это возможно лишь благодаря компьютерам, которые умеют считать слова и производить математические подсчеты». Когда релевантные издания будут выявлены, можно будет ознакомиться с ними подробнее.
И хотя книги, написанные на скандинавских языках, составляют лишь малую часть всего массива Google Books, Леонард и Танджерлини надеются разработать стратегии, единые для всех языков, которые подойдут и тем, кто изучает итальянскую литературу и тем, кто занимается литературой юга Америки.