06.04.2018 Views

125_80_m

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Machine Learning<br />

Обучение с учителем<br />

и без учителя<br />

Большую часть задач машинного обучения<br />

можно разделить на обучение с<br />

учителем (supervised learning) и обучение<br />

без учителя (unsupervised learning).<br />

Если вы представили себе программиста<br />

с плеткой в одной руке и пряником<br />

данных признаков будет предсказывать<br />

стоимость квартиры. Это классический<br />

пример обучения с учителем, где у нас<br />

есть данные (10000 квартир и различные<br />

параметры для каждой квартиры,<br />

называемые признаками) и отклики<br />

(стоимость квартиры). Такая задача называется<br />

задачей регрессии. О том, что<br />

это такое, мы поговорим чуть позже.<br />

О машинном<br />

обучении<br />

простым языком<br />

Технологии машинного<br />

обучения сегодня проникают<br />

повсюду. Но многие<br />

даже не знают, на что<br />

машинное обучение способно<br />

в действительности<br />

или имеют неверное представление об<br />

этом процессе. Тем не менее, сфер, где<br />

может быть применено и уже применяется<br />

машинное обучение - великое<br />

множество. Начиная от анализа пробок<br />

на дорогах и заканчивая самоуправляемыми<br />

автомобилями. Во всех этих<br />

вопросах все больше задач перекладывается<br />

на самообучаемые машины. И<br />

мы порой даже примерно не представляем,<br />

как работают некоторые<br />

приложения, основанные на методах<br />

машинного обучения. Например, никто<br />

не сможет вам ответить на вопрос «Почему<br />

мне сегодня в рекламе показали<br />

этот продукт, а не другой?».<br />

Введение<br />

Машинное обучение считается ветвью<br />

искусственного интеллекта, основная<br />

идея которого заключается в том,<br />

чтобы научить компьютер не просто<br />

использовать заранее написанный<br />

алгоритм, а самому решать поставленные<br />

задачи. Любую работающую<br />

технологию машинного обучения можно<br />

условно отнести к одному из трех<br />

уровней доступности. Первый уровень<br />

- это когда она доступна только различным<br />

технологическим гигантам уровня<br />

IBM или Google. Второй уровень - это<br />

когда ею может воспользоваться<br />

студент с некоторым багажом знаний.<br />

Третий уровень - это когда с ней будет<br />

способен совладать даже не разбирающийся<br />

в технологиях человек. И<br />

сегодня машинное обучение находится<br />

на стыке второго и третьего уровней,<br />

за счет чего скорость изменения мира<br />

с помощью данной технологии растет с<br />

каждым днем.<br />

38 /3/2018<br />

в другой, то вы немного ошиблись.<br />

Под «учителем» здесь понимается<br />

сама идея вмешательства человека в<br />

обработку данных. При обучении с учителем<br />

у нас есть данные, на основании<br />

которых нужно что-то предсказать, а<br />

также некоторые гипотезы. При обучении<br />

без учителя у нас есть только<br />

данные, свойства которых мы и хотим<br />

найти. На примерах вы эту разницу почувствуете<br />

немного лучше.<br />

Обучение с учителем<br />

Например, у нас есть данные о 10000<br />

квартирах в Баку, причем, известна<br />

площадь каждой квартиры, количество<br />

комнат, этаж, на котором она расположена,<br />

район, наличие парковки, расстояние<br />

до ближайшей станции метро и т.д.<br />

Кроме того, известна стоимость каждой<br />

квартиры. Нашей задачей является<br />

построение модели, которая на основе<br />

Красные точки - имеющиеся данные<br />

(по оси X - значение признака, по оси Y - значение ответа),<br />

синяя прямая - построенная модель.<br />

Другим примером может стать такая<br />

задача: на основании различных<br />

медицинских показателей предсказать<br />

наличие у пациента рака. Или на<br />

Задача классификации. На первой картинке объекты<br />

разделяются прямой, а на второй - более сложной кривой.<br />

Заметьте, что некоторые объекты классифицируются<br />

неправильно. Это нормальная практика<br />

в задачах классификации.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!