Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: LXXV Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 19 августа 2019 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Юрлов М.В. ОБЗОР СОВРЕМЕННЫХ ЯЗЫКОВ ПРОГРАММИРОВАНИЯ ДЛЯ РАБОТЫ С «БОЛЬШИМИ ДАННЫМИ» // Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ: сб. ст. по мат. LXXV междунар. студ. науч.-практ. конф. № 16(75). URL: https://sibac.info/archive/meghdis/16(75).pdf (дата обращения: 24.04.2024)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

ОБЗОР СОВРЕМЕННЫХ ЯЗЫКОВ ПРОГРАММИРОВАНИЯ ДЛЯ РАБОТЫ С «БОЛЬШИМИ ДАННЫМИ»

Юрлов Михаил Викторович

студент 4 курса, кафедра АСУ, Уфимский государственный авиационный технический университет,

РФ, гУфа

Разработчики программного обеспечения любят спорить о том, какой язык программирования является лучшим. Однако критерий того, что является «лучшим», сбивает с толку. Когда мы обсуждаем разработку программного обеспечения для использования в машинном обучении и областях науки, связанных с данными, этот вопрос вечен и никогда не потеряет своей актуальности.

Лучшими языками программирования являются языки, объединяющие в себе простоту синтаксиса и использования, что является довольно субъективным критерием, но такие факторы, как безопасность, скорость, количество библиотек и поддержка сообщества такими не являются, поэтому при выборе будет происходить упор на них. Итак, давайте рассмотрим шесть лучших языков программирования для работы с данными и машинным обучением.

Scala [1]

Scala является популярным языком программирования, и, скорее всего, большинство ученых, работающих с данными, сталкивались с ним. Это мультипарадигмальный язык, поддерживающий использование открытого исходного кода. Язык был разработан в 2003 году Мартином Одерским. Scala – это сокращенная форма «Scalable Language». Он был создан для того, чтобы излагать стандартные основы программирования элегантным, безопасным и лаконичным образом.

Если вы знакомы с синтаксисом Java, вы можете быстро освоить Scala. Изучение этого языка значительно проще, если вы знаете другие языки, такие как Python, C или C ++. Многие предпочитают Scala, так как он стабильный, гибкий, быстрый и масштабируемый. Написание программного кода в Scala организуется и выполняется довольно быстрее по сравнению с Python. При этом его можно применять Scala для создания прибыльных продуктов, которые работают с огромным количеством данных.

Julia [2]

Julia набирает популярность в мире данных и машинного обучения. Некоторые эксперты уже сравнивают его с Python, что, возможно, является преждевременным выводом, но это ни в коей мере не уменьшает возможности Julia.

Этот язык программирования является современным, высокопроизводительным и значительным, был создан группой математиков из Массачусетского технологического института (MIT) и ученых-компьютерщиков. Данный язык, в основном, применяется для манипуляции большим количеством данных и научных расчетов. Если вы раньше работали с такими языками как Matlab, R или Python, то Вы быстро привыкнете к Julia. Скорость Julia делает его отличным языком для машинного обучения и науки о данных.

JavaScript

Если вы пытаетесь войти в науку о данных как разработчик и не хотите изучать новый язык, JavaScript – это Ваш выбор. JavaScript - легкий, простой в реализации и мощный язык программирования.

Прежде чем приступить к работе с JavaScript, не мешало бы иметь опыт работы с HTML и иметь опыт работы с концепциями объектно-ориентированного программирования. Это дает вам основную идею разработки онлайн-приложений. Это также становится полезным, когда Вы расширяете свой модуль машинного обучения в браузере или мобильных приложениях. Помимо этого, в JavaScript есть замечательные библиотеки для разработки информационных панелей и визуализации данных. Многие методы машинного обучения, такие как сочинение музыки, распознавание возражений и жестов и т. д., могут быть реализованы с помощью TensorFlow.js, который является динамической библиотекой JavaScript для работы с данными.

Swift [3]

Если вы являетесь поклонником продукции Apple и Вам нравится использовать их многочисленные устройства и их привлекательную iOS, скорее всего, вам понравится Swift. Этот язык программирования является открытым, гибким и простым. Apple создала его для приложений OS x и iOS. Swift основан на лучшем из Objective-C и C, но без ограничений адаптируемости C. Это отличный язык для начинающих из-за его точного, но обширного синтаксиса и быстрой скорости работы приложений.

В последнее время Swift начал привлекать внимание сообщества специалистов в области данных и машинного обучения. Это настоятельно рекомендуется Джереми Ховардом, соучредителем fast.ai. Существует множество библиотек для выполнения таких задач, как высокопроизводительные вычисления в матричной математике, численных вычислений, использования методов глубокого обучения, обработки цифрового сигнала, разработки моделей машинного обучения и т.д.

Golang [4]

Go, или Golang – это язык программирования, разработанный Google. Go эффективен, прост и надежен. Решения на Go довольно однозначны, что помогает избежать разногласий при разработке, концентрируясь на одной технике за раз по сравнению с другими языками, где задачи имеют несколько решений.

Существует огромное количество ресурсов, инструментов и пакетов для работы с данными на Golang. Это включает в себя статистические и арифметические вычисления, сбор данных, анализ данных, EDA, организацию данных, создание моделей машинного обучения и т.д.

Spark [5]

Spark – это не столько язык, сколько среда, но есть причина, по которой он так популярен среди исследователей и инженеров в области работы с данными.

Spark предлагает высокоуровневые API-интерфейсы (интерфейс прикладного программирования) на R, Python, Scala и Java, а также предоставляет оптимизированный механизм, поддерживающий отличные графики выполнения. Он является открытым и быстрым кластерным фреймворком для вычислений, который применяется для обработки, проверки и оценки больших данных. Преимущество Spark перед другими фреймворками для работы с большими данными заключается в том, что они основаны на вычислениях в памяти, что позволяет ему работать очень быстро.

Минимального опыта в Python достаточно, чтобы быстро освоить Spark. Spark может выполнять множество заданий по обработке данных, таких как предварительная оценка данных, их создание и отладка.

 

Список литературы:

  1. The Scala Programming Language [Электронный ресурс] – Режим доступа. –  URL: https://www.scala-lang.org (дата обращения: 15.08.2019)
  2. The Julia Language [Электронный ресурс] – Режим доступа. –  URL: https://julialang.org (дата обращения: 15.08.2019)
  3. About Swift // Swift.org [Электронный ресурс] – Режим доступа. –  URL: https://swift.org/about/ (дата обращения: 15.08.2019)
  4. The Go programming language [Электронный ресурс] – Режим доступа. –  URL: https://golang.org (дата обращения: 16.08.2019)
  5. Unified Analytics Engine for Big Data // Apache Spark [Электронный ресурс] – Режим доступа. –  URL: https://spark.apache.org (дата обращения: 16.08.2019)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.