532
ПРОГРАММНЫЕ СРЕДСТВА СТАТИСТИЧЕСКОГО АНАЛИЗА
ДАННЫХ
к.т.н., доц. Ходиев Шухрат Ильхамович
Национальный университет Узбекистана
Аннотация:
Одним из обязательных этапов любого научного
исследования является статистический анализ данных. К статистическим
методам проявляется повышенный интерес как к одному из важнейших
аналитических инструментариев в различных областях науки.
Рассматриваются
применения алгоритмов статистического анализа и новых цифровых технологий
для изучения социальной реальности.
Ключевые слова:
статистический анализ данных, электронные таблицы,
пакеты и алгоритмы анализа, большие данные.
Введение.
Выполнение расчётов является сильной стороной компьютеров.
Они хорошо комбинируют и анализируют большие объёмы данных. С
информацией подобного рода работает дисциплина статистика. Существует
большое число стандартных видов статистического анализа и программ,
производящих необходимые вычисления. Считают, что статистические задачи
трудно
программировать
хорошо,
без
ошибок.
Комбинирование
многочисленных фрагментов и затем вывод из них соответственной информации
это одна из основных задач реализации. В этой работе, однако, не
рассматриваются непосредственные реализации этих процессов, а только
направления исследований, применение современного соответственного
программного обеспечения, обоснование их применения.
Основная часть.
Социология интернета, социология социальных сетей,
социология онлайн сообществ, иные направления исследований прочно вошли в
структуру социологического знания. Сегодня эти направления интегрируются в
рамках более глобального концепта — цифровой социологии [1]. Возникли такие
концепты, как например, «цифровая экономика», «цифровое (электронное)
правительство», «цифровое образование».
Компонентами, составляющими содержание цифровой социологии
являются 1) профессиональная цифровая практика (использование цифровых
инструментов в рамках социологической практики, создание научных сетей,
онлайн профилей, публикация и обмен исследований, консультирование
студентов); 2) анализ применения цифровых технологий (изучение того, как
использование людьми цифровых технологий формирует их самоощущение, их
воплощение и их социальные отношения, а также роль цифровых медиа в
создании или воспроизводстве социальных институтов и социальных структур);
3) анализ цифровых данных (использование цифровых данных, генерируемых
пользователями,
для
социальных
исследований,
количественных
и
качественных); 4) критическая цифровая социология (рефлексивный анализ
533
цифровых технологий с точки зрения социальных и культурологических
теорий).
Одним из измерений цифровой социологии является использование
больших наборов цифровых данных для проведения социологических
исследований. Такие «электронные исследования» обозначают с помощью
различных терминов: цифровые социальные исследования, вебометрика,
вебсоциальные исследования, вычислительные социальные науки и др.
Основное внимание в рамках этого направления исследований уделяется сбору,
использованию данных и инструментам для анализа этих данных.
Можно
выделить
четыре
компьютерные
технологии, активно
использующиеся в социальных науках: интеллектуальный анализ данных (data
mining), большие данные (big data), цифровые гуманитарные науки (digital
humanity), наука о данных (data science). В частности, технология data mining
рассчитана прежде всего на выявление закономерностей в больших массивах
данных. Массивы данных обрабатываются, комбинируются, преобразуются
таким образом, чтобы извлечь интересующие исследователя закономерности.
Технология data mining включает в себя различные средства визуализации
данных, в извлечении из больших объемов данных неочевидных, объективных и
полезных на практике закономерностей. Это значит, что найденные
закономерности не обнаруживаются стандартными методами обработки
информации или экспертным путем» [2, с. 144]. В этом состоит одно из
существенных отличий методов data mining от традиционных
статистических
методов анализа данных
. Последние в основном ориентированы на проверку
заранее сформулированных гипотез и на грубый разведочный анализ, а data
mining нацелен на обнаружение прежде всего неочевидных, неявных
взаимосвязей.
Наука о данных предполагает «фокусирование внимания на данных, а в
более широком смысле на статистике, которая представляет собой
систематическое исследование организации, свойств и анализа данных и их роли
в выводе. К техническим проблемам относят сбор и регистрацию данных,
первичный анализ и поиск корреляций (data mining), алгоритмы которого при
большом количестве переменных могу давать заметные искажения, анализ
данных (data analysis),
Существует около тысячи распространяемых на мировом рынке пакетов,
решающих в том или ином виде задачи статистического анализа данных.
Различают
профессиональные
пакеты (для математиков),
популярные
или
универсальные
пакеты для широкого круга пользователей для решения широкого
круга задач: SPSS, STATISTICA, SYSTAT и другие.
Специальные
пакеты
используются для решения узкого круга задач. Они позволяют исследователю
формировать собственные математические модели, аппроксимировать
двухфазные зависимости. Большим шагом вперёд к развитию статистической
науки послужило применение экономико-математических методов и
использование компьютерной техники в анализе социально-экономических
явлений. Из инструментария, активно используемого в мире в области анализа
данных, в основном программистами (разработчиками и исследователями),
534
наиболее известны библиотека численных и статистических методов IMSL,
конкурент по численным методам NAG, а также интерактивная среда со
встроенным языком программирования. В частности, к статистическим методам
проявляется повышенный интерес как к одному из важнейших аналитических
инструментариев в сфере поддержки процессов принятия решений [3,4].
Использованная литература:
1. Lupton D. Digital Sociology. L., N. Y.: Routledge, 2015. – 230 p.
2. Мосягин А.Б. Использование методологии data mining при решении
задач обработки социальных данных // Мониторинг общественного мнения:
экономические и социальные перемены. 2015. No 2 (126). – С. 143–145.
3. Наследов А.Д. SPSS: Компьютерный анализ данных в психологии и
социальных науках / А.Д. Наследов. – СПб.: Питер, 2005. – 416 с.
4. Наследов А.Д. Математические методы в психологических
исследованиях. Анализ и интерпретация данных / А.Д. Наследов. – СПб: Речь,
2012. – 392 с.
HOZIRGI IQTISODIY TARAQQIYOT DAVRIDA GEOGRAFIYA FANINI
OʻQITISHNING PEDAGOGIK ZARURATI
Janizoqov Ilyos
O‘zbekiston Milliy universiteti Jizzax filiali
Annotatsiya:
Maqolada geografiya fanini vujudaga kelish tarixi va maqsad va
vazifalarini inobatga olib, iqtisodiyotni rivojlantirishdagi oʻrni haqida soʻz yuritilgan.
Kalit so‘zlar:
geografiya, qadimgi yoki antik davr bosqichi, o‘rta asrlar
bosqichi, buyuk geografik kashfiyotlar bosqichi, ilmiy geografik ishlar bosqichi.
Kirish.
Geografiya eng qadimgi va hamisha navqiron fanlardan biri. Geografik
kashfiyotlar, g‘oya va bilimlarning rivojlanish xususiyatlariga asoslanib, bu fanning
tarixida quyidagi bosqichlarni ajratish mumkin.
Qadimgi yoki antik davr bosqichi.
Ibtidoiy odamlarning o‘zi yashab turgan
joyni o‘rganish, yashash uchun qulay, tabiiy resurslarga boy joylarni topish va
tasvirlashga bo‘lgan intilishlari asnosida dastlabki Geografik bilimlar
to‘planib borgan. Er.avv. 2-ming yillikda finikiyaliklar O‘rta dengizdan
Gibraltar bo‘g‘izi orqali suzib o‘tib, Afrika qirg‘oqlari bo‘ylab Hindistongacha suzib
borganlar. Shu paytdan Osiyo va Yevropa nomlari paydo bo‘lgan.
O‘rta asrlar bosqichi.
Bu davrda geografiya fanining rivojida Abu Rayhon
Beruniyning xizmati beqiyos. Uning geografiyaga oid 22 ta asari bo‘lib, shundan 12
tasi geodeziya, 4 tasi kartografiya, 3 tasi iqlimshunoslik, 3 tasi mineralogiyaga oid va
hozirgi kunda ham dolzarb hisoblanadi. U yasagan globus esa Yerning sharsimonligini
isbotlash va tushuntirishda, Shimoliy yarimshar tabiatini o‘rganishda tengi yo‘q manba