Статья опубликована в рамках: Научного журнала «Студенческий» № 21(191)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6, скачать журнал часть 7, скачать журнал часть 8, скачать журнал часть 9
БОЛЬШИЕ ДАННЫЕ И МАШИННОЕ ОБУЧЕНИЕ
АННОТАЦИЯ
В статье рассматривается изучение Больших Данных и их характеристик, актуальность их применения и важность для нашей повседневной жизни. При этом особое внимание уделяется способу обработки данных такого типа, в частности, наиболее эффективным методом считается машинное обучение.
Ключевые слова: Большие данные, анализ, машинное обучение.
Большие данные (Big Data) относятся к технологиям обработки структурированных и неструктурированных данных, объем которых постоянно растет. Недавно появилось различие между обычными структурированными базами данных с четкой и понятной обработкой и большими данными, которые изначально не обладают большим объемом информации, но характеризуются прежде всего тем, что могут адаптироваться к поставленной задаче благодаря использованию "машинного обучения".
Практически во всех областях человеческой жизни постоянно генерируются большие объемы данных. К ним относятся социальные сети, медицина, банковское дело и реклама, а также системы устройств, которые получают многочисленные результаты ежедневных вычислений. Информация из различных систем отслеживания передается в режиме реального времени на серверы компаний, использующих Big Data. Технологии больших данных неразрывно связаны с исследованиями и разработками и коммерцией. Она также начинает проникать в государственное управление, где требуются все более эффективные системы хранения и идентификации информации. Использование больших данных широко распространено среди интернет-ресурсов, продающих товары и услуги. В основном это связано с возможностью получения большого количества сведений о действиях пользователей на этих ресурсах. Рекомендуемые фильмы для просмотра, музыка для прослушивания, книги для чтения и статьи для ознакомления, контекстная реклама и спам-фильтры в электронных письмах, сайты знакомств.
Машинное обучение - это математическая дисциплина, которая решает проблему поиска закономерностей в эмпирических данных; на основе этого алгоритм может делать определенные прогнозы. Машинное обучение относится к методам искусственного интеллекта, поскольку оно не решает проблему напрямую, а обучается применять решение к набору схожих проблем. Машинное обучение располагается между математической статистикой, методами оптимизации и классическими математическими дисциплинами, но также имеет специфику, связанную с вычислительной эффективностью и проблемами переобучения. Кроме того, многие методы тесно связаны с извлечением информации и поиском данных. Машинное обучение устраняет необходимость программиста указывать компьютеру, как именно решить ту или иную проблему. Компьютер обучается находить решение самостоятельно. Алгоритму предоставляется набор необходимых данных, а затем он использует их для обработки запросов.
Машины научились видеть изображения и классифицировать их. Они могут распознавать текст, цифры, людей и местность на этих изображениях. Компьютеры не только распознают отличительные признаки для сортировки, но и учитывают контекст, в котором они используются.
Методы машинного обучения помогают лучше понимать клиентов, легче находить товары, повышать конверсию и оценивать риски, связанные с теми или иными инвестициями. По данным опроса, проведенного MIT Review Custom и Google Cloud*, 60% респондентов, представляющих самые разные компании, отметили, что машинное обучение является их основным методом обработки больших объемов данных. Основные мотивы респондентов включали желание получить новые знания из своих данных, получить конкурентное преимущество, ускорить анализ информации и предложить продукты нового поколения.
Таким образом, большие данные стали неотъемлемой частью нашей повседневной жизни. Ежедневно собирается огромное количество информации о нас и наших пожеланиях для разработки сложных концепций умных домов, умных городов, Интернета вещей (IoT) и так далее. Так анализ больших данных помогает улучшить и изменить практически все аспекты нашей жизни. Большие данные открывают перед нами новые горизонты в производственном планировании, образовании, здравоохранении и других сферах. По мере своего развития технологии больших данных могут вывести фактор производства информации на совершенно иной качественный уровень.
*(По требованию Роскомнадзора информируем, что иностранное лицо, владеющее информационными ресурсами Google является нарушителем законодательства Российской Федерации – прим. ред)
Список литературы:
- «Большие данные (Big Data),» 24.10.2017. [Электронный ресурс]. Available: http://tadvi er.ru/a/125096, дата обращения: 22.03.2018.
- Денисова О.О. и Мухутдинов Э.А. «Большие данные – это не только размер данных» // Вестник технологического университета, т. 18, № 4, p. 5, 2015.
- Себрант А. «Что такое Big Data и почему это страшно интересно,» 06.03.2014.
Оставить комментарий