Статья опубликована в рамках: Научного журнала «Студенческий» № 21(149)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5
ПРОБЛЕМА ДОСТОВЕРНОСТИ ИНФОРМАЦИИ В БАЗАХ ДАННЫХ
THE PROBLEM OF RELIABILITY OF INFORMATION IN DATABASES
Dmitry Konovalov
student, Armavir state pedagogical University,
Russia, Armavir
Vladimir Belchenko
Candidate of Technical Sciences, Associate Professor, Director of the Institute of Applied Informatics, Mathematics and Physics, Armavir state pedagogical University,
Russia, Armavir
АННОТАЦИЯ
Для того, чтобы данные можно было легко находить, они должны быть систематизированы, даже в том случае если данные об объекте находятся в разных таблицах. В этом нелегком деле помогают базы данных.
Существуют множество различных архивов с ценной информацией, которая с годами может быть утеряна. Зачастую такие архивы занимают целые библиотеки, и поиск необходимых документов требует время, и значительные усилия.
В настоящее время проходит цифровизация, и все данные, которые находятся на печатных носителях, должны быть оцифрованы и загружены в виде документов на выделенный сервер. Возникает вопрос, как среди терабайтов данных найти определенную информацию? Ответ на этот вопрос дает систематизированное хранение данных. Возникает следующий вопрос как систематизировать эту информацию? В этом помогают базы данных.
В отличие от обыкновенной бумажной карты, карта, созданная в ГИС, может содержать дополнительную информацию, которую можно «просмотреть» по необходимости. Но как проверять качество и достоверность данной дополнительной информации? В этой статье я постараюсь ответить на вопрос.
ABSTRACT
In order for the data to be easily found, it must be systematized, even if the data about the object is in different tables. Databases help in this difficult task.
There are many different archives with valuable information that may be lost over the years. Often, such archives occupy entire libraries, and the search for the necessary documents requires time and considerable effort.
Currently, digitalization is taking place, all data that is on printed media must be digitized and uploaded as documents to a dedicated server. The question arises, how to find certain information among terabytes of data? The answer to this question is given by systematized data storage. The following question arises: how to systematize this information? Databases help with this.
Unlike an ordinary paper map, a map created in a GIS can contain additional information that can be "viewed" as needed. But how to check the quality and reliability of this additional information? In this article, I will try to answer the question.
Ключевые слова: Базы данных, ошибки в базах данных, программирование, анализ данных.
Keywords: Databases, errors in databases, programming, data analysis.
Введение
Для того чтобы данные были достоверными необходимо вводить различные проверки информации. Это могут быть, как и данные, полученные от пользователей, так и данные находящиеся в базе данных справочного бюро, а также различная задокументированная информация. Касательно первого возникает проблема субъективности восприятия информации.
Эта проблема может быть решена оценками пользователей. В качестве примера такой проверки я могу привести простейшую программу «Антирадар», в этой программе пользователи оставляют местоположение, а также направление камеры автомагистрали, и если другой пользователь увидит эту камеру, он может поставить положительную оценку. Таким образом, данные проверяются многократно в процессе эксплуатации программы. Кроме того, чтобы решить проблему субъективности, можно вводить контрольные группы, которые оценивают данные объективно.
Также проблема достоверности информации может возникать из-за постоянно изменяющегося законодательства, такие изменения носят случайный характер и приводят к нарушению достоверности информации, а в свою очередь данные изменения могут привести к ошибкам в программных приложениях, поддерживающих процессы принятия решений. При проектировке приложения из-за недостаточно полного использования методов и механизмов контроля данных, могут служить причиной снижения достоверности.
Проблемы достоверности могут возникать и по ошибке человека, который вводит эти данные. Например, ошибка в названии улицы или ошибка в фамилии опрашиваемого.
Ошибки вычислительной техники на несколько порядков менее вероятны, чем ошибки при занесении данных на носитель. Ошибки в первичных данных возникают из-за несовершенства измерительных систем, средств регистрации и передачи информации. В результате могут появиться значения параметров, выходящие за физически допустимые пределы, ошибки в кодировании значений ключевых характеристик, появление двух одинаковых экземпляров свойств объекта и др.
Записи в Базе данных могут дублироваться, и из-за этого возникают сбои в работе. Такая проблема возникла и со мной, когда меня регистрировали на ГосУслугах. По какой-то причине в системе создалось два личных кабинета, которые конфликтовали между собой, я не смог зайти не в один из кабинетов.
Сбои в работе серверов также могут исказить данные. Например, Пользователь добавил запись об объекте, а она не добавилась, потому что сервер внезапно прекратил свою работу.
Преднамеренные ошибки получаются в результате того, что наблюдатель записывает не наблюденные, а предполагаемые данные. Нередки случаи преднамеренного искажения в отчетах сведений об объеме выпущенной продукции, об остатках дефицитного сырья, материалов и т.д. Непреднамеренные ошибки вызываются различными случайными причинами, чаще всего обусловленные, например, неправильно используемым методом и прибором измерений.
Такие мелкие на первый взгляд проблемы могут служить причиной дыры в бюджете страны. Ведь если в Базе Данных налоговой службы указана неверная информация, то такие данные приводят к неправильному выставлению счетов. Американский институт хранилищ данных (The Data Warehouse Institute) подсчитал, что низкое качество данных обходится американскому бизнесу примерно в 600 млрд. долларов ежегодно.
Выводы:
Для достоверности информации необходимо объективное мнение, которого зачастую не может существовать. Старая информация также снижает достоверность данных. Способов решений данной проблемы много, у каждого способа свои преимущества и недостатки. С развитием технологий Искусственного Интеллекта данная проблема исчезнет.
Список литературы:
- Анализ последовательностей и таблиц данных. - Сборник научных трудов, Новосибирск, 1994.
- Булатов В.П. Меренков А.П. Методы оптимизации и их приложения. -"Наука", 1972.
- Кульба В.В. Шелков А.В. Достоверность и сохранность информации в АСУ. М, Наука, 1996.
- Hagler M. Spreadsheet Solution of Partial Differential Equations. IEEE Transact. Education, August 1987.
Оставить комментарий