15.11.2013 Views

akzhigitova-dissertacia.pdf

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

служат Интернет-ресурсы, где в небольших объемах представлены<br />

электронные тексты разного рода и жанра. Наличие электронного материала в<br />

сети Интернет в Казахстане дает право говорить о возможном преобразовании<br />

и информатизации текстов в корпусы текстов, представленные на казахском<br />

языке и классифицировать на следующие так называемые «подкорпуса» (при<br />

классификации используется опыт национального корпуса русского языка<br />

[http://www.ruscorpora.ru]):<br />

1) корпус современных СМИ, в котором представлены газетные и<br />

журнальные статьи, интервью из средств массовой информации,<br />

различного рода ТВ- и радиопередачи;<br />

2) параллельные корпуса, которые предоставляют все варианты переводов<br />

для определенного слова или словосочетания на казахский язык или с<br />

казахского языка (казахско-русский, русско-казахский параллельные<br />

корпуса);<br />

3) корпус художественных (поэтических и прозаических) текстов;<br />

4) обучающий корпус казахского языка;<br />

5) корпус устной речи, включающий расшифровки аудио-цифровых<br />

записей публичной и частной устной речи;<br />

6) мультимедийный корпус, куда входят снабженные видео- и аудиорядом<br />

фрагменты передач и фильмов;<br />

7) рекламный корпус, куда входят тексты реклам, заголовки;<br />

8) ономастический корпус, включающий различного рода наименования.<br />

Мы выделили всего 8 подкорпусов, так как считаем, что их ресурсная база<br />

уже существует. Следует особо подчеркнуть важность включения таких<br />

подкорпусов, как рекламный и ономастический. Исследования, проводимые<br />

нами в данной области показывают, что тексты реклам и названия каких-либо<br />

объектов могут отражать динамику развития того или иного языка в разные<br />

периоды времени (на уровнях словообразования и функционирования).<br />

Поэтому считаем целесообразным внедрения данных подкорпусов в<br />

национальный корпус. При создании национального корпуса стоит учитывать и<br />

его объем. Национальный корпус должен быть, прежде всего, объемным и<br />

измеряться сотнями миллионов словоупотреблений. Но, кроме того, он – и это<br />

даже важнее – должен быть представительным. Иначе говоря, он должен<br />

содержать все типы текстов, представленные в данном языке в данный<br />

исторический период, и при этом содержать их в правильной пропорции.<br />

В настоящее время создание национальных корпусов базовых<br />

государственных языков ведущих стран мира возведено в ранг важных<br />

историко-культурных и политических мероприятий современности. И в нашей<br />

стране актуализируется проблема создания этого языкового инструмента,<br />

представляющего государственный язык во всем его богатстве, многообразии<br />

стилей, жанров, только ему присущих особенностей, причем в удобной для<br />

использования современной форме. Для этого требуются как финансовые<br />

вложения государства, так и слаженная работа высококвалифицированных<br />

118

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!