Московский государственный технический университет им. Н.Э. Баумана
Список авторов организации
Список статей, написанных авторами организации
-
Статистика нечисловых данных - центральная часть современной прикладной статистики
08.00.13 Математические и инструментальные методы экономики (экономические науки)
Краткое описаниеВ 1979 г. статистика нечисловых данных была выделена как самостоятельная область прикладной статистики. Первоначально для обозначения этой области математических методов экономики использовался термин "статистика объектов нечисловой природы". Наш базовый учебник по статистике нечисловых данных называется "Нечисловая статистика". Статистика нечисловых данных - одна из четырех основных областей прикладной статистики (наряду со статистикой чисел, многомерным статистическим анализом, статистикой временных рядов и случайных процессов). Статистика нечисловых данных делится на статистику в пространствах общей природы и разделы, посвященные конкретным типам нечисловых данных (статистика интервальных данных, статистика нечетких множеств, статистика бинарных отношений и др.). В настоящее время статистика в пространствах общей природы - центральная часть прикладной статистики, а включающая ее статистика нечисловых данных - основная область прикладной статистики. Это утверждение подтверждается, в частности, анализом публикаций в разделе "Математические методы исследования" журнала "Заводская лаборатория. Диагностика материалов" - основном месте публикаций отечественных исследований по прикладной статистике. Настоящая статья посвящена анализу основных идей статистики нечисловых данных на фоне развития прикладной статистики с позиций новой парадигмы математических методов исследования. Описаны различные виды нечисловых данных. Проанализирован исторический путь статистической науки. Рассказано о развитии статистики нечисловых данных. Разобраны основные идеи статистики в пространствах общей природы: средние величины, законы больших чисел, экстремальные статистические задачи, непараметрические оценки плотности распределения вероятностей, методы классификации (диагностики и кластер-анализа), статистики интегрального типа. Кратко рассмотрены некоторые статистические методы анализа данных, лежащих в конкретных пространствах нечисловой природы: непараметрическая статистика (реальные распределения обычно существенно отличаются от нормальных), статистика нечетких множеств, теория экспертных оценок (медиана Кемени - это выборочное среднее экспертных упорядочений) и др. Обсуждаются некоторые нерешенные задачи статистики нечисловых данных
-
Система моделей и методов проверки однородности двух независимых выборок
08.00.13 Математические и инструментальные методы экономики (экономические науки)
Краткое описаниеНовая парадигма математических методов исследования позволяет дать системный анализ различных постановок задач анализа статистических данных и методов их решения, основанных на принятой исследователем той или иной вероятностно-статистической модели порождения данных. Методы проверки однородности двух независимых выборок - классическая область математической статистики. За более чем 111 лет с момента публикации основополагающей статьи Стьюдента разработаны критерии проверки статистической гипотезы однородности в различных постановках, изучены их свойства. Однако актуальна потребность в упорядочении совокупности найденных научных результатов. Необходим анализ всего многообразия постановок задач проверки статистических гипотез однородности двух независимых выборок, а также соответствующих статистических критериев. Такому анализу посвящена настоящая статья. Дана сводка основных результатов, касающихся методов проверки однородности двух независимых выборок, и проведено их сравнительное изучение, позволяющие системно анализировать многообразие таких методов с целью выбора наиболее адекватного для обработки конкретных данных. На основе базовой вероятностно-статистической модели сформулированы основные постановки задачи проверки однородности двух независимых выборок. Дан сравнительный анализ критериев Стьюдента и Крамера - Уэлча, предназначенных для проверки однородности математических ожиданий, обоснована рекомендация по широкому применению критерия Крамера - Уэлча. Из непараметрические методов проверки однородности рассмотрены критерии Вилкоксона, Смирнова, Лемана - Розенблатта. Разобраны два мифа о критерии Вилкоксона. На основе анализа публикаций основоположников показана некорректность термина "критерий Колмогорова - Смирнова". Для проверки абсолютной однородности, т.е. совпадения функций распределения выборок, рекомендовано использовать критерий Лемана - Розенблатта. Обсуждаются актуальные проблемы разработки и применения непараметрических критериев, в том числе различие номинальных и реальных уровней значимости, затрудняющее сравнение критериев по мощности, и необходимость учета совпадений выборочных значений (с точки зрения классической теории математической статистики вероятность совпадений равна 0)
-
Метод ценообразования на основе оценивания функции спроса
08.00.13 Математические и инструментальные методы экономики (экономические науки)
Краткое описаниеПри решении некоторых задач экономики и управления на предприятии возникает необходимость определения розничной цены товара или услуги при известной оптовой цене или цене производителя. Предлагаем определять розничную цену на основе анализа данных опроса потенциальных потребителей о максимально возможной для них цене на рассматриваемый товар или услугу. Розничную цену рассчитываем на основе оптимизации экономического эффекта, равного произведению результата от продажи одной единицы товара на функцию спроса, которую оцениваем путем опроса потребителей. Для решения оптимизационной задачи функцию спроса приближаем с помощью метода наименьших квадратов. Как примеры проанализированы линейная и степенная модели функции спроса. Обсуждаются пути дальнейшего развития предложенного подхода. Сформулированы нерешенные научные задачи. Требуют дальнейшей проработки методы оценивания функции спроса в условиях большого количества повторов в ответах респондентов и их склонности к "круглым цифрам", вследствие чего нельзя пользоваться критерием Колмогорова для определения точности восстановления функции спроса. Различные параметрические и непараметрические подходы регрессионного анализа должны быть адаптированы к рассматриваемой задаче восстановления зависимости спроса от цены, равно как и методы решения соответствующих оптимизационных задач
-
Основные требования к методам анализа данных (на примере задач классификации)
08.00.13 Математические и инструментальные методы экономики (экономические науки)
Краткое описаниеНазрела необходимость навести порядок в методах классификации. Это повысит их роль в решении прикладных задач, в частности, при диагностике материалов. Для этого прежде всего следует выработать требования, которым должны удовлетворять методы классификации. Первоначальная формулировка таких требований - основное содержание настоящей работы. Математические методы классификации рассматриваются как часть методов прикладной статистики. Обсуждаются естественные требования к рассматриваемым методам анализа данных и представлению результатов расчетов, вытекающие из накопленных отечественной вероятностно-статистической научной школой достижений и идей. Даются конкретные рекомендации по ряду вопросов, а также критика отдельных ошибок. В частности, методы анализа данных должны быть инвариантны относительно допустимых преобразований шкал, в которых измерены данные, т.е. методы должны быть адекватны в смысле теории измерений. Основой конкретного статистического метода анализа данных всегда является та или иная вероятностная модель. Она должна быть явно описана, ее предпосылки обоснованы - либо из теоретических соображений, либо экспериментально. Методы обработки данных, предназначенные для использования в реальных задачах, должны быть исследованы на устойчивость относительно допустимых отклонений исходных данных и предпосылок модели. Должна указываться точность решений, даваемых с помощью используемого метода. При публикации результатов статистического анализа реальных данных необходимо указывать их точность (доверительные интервалы). В качестве оценки прогностической силы алгоритма классификации вместо доли правильных прогнозов рекомендуется использовать прогностическую силу. Математические методы исследования делятся на "разведочный анализ" и "доказательную статистику". Специфические требования к методам обработки данных возникают в связи с их "стыковкой" при последовательном выполнении. Обсуждаются границы применимости вероятностно-статистических методов. Рассматриваются также конкретные постановки задач классификации и типовые ошибки при применении различных методов их решения
-
Модели трансферта технологий между оборонным и гражданским сектором экономики
08.00.13 Математические и инструментальные методы экономики (экономические науки)
Краткое описаниеВ статье рассмотрена проблема повышения эффективности бюджетных расходов за счет передачи военных технологий в гражданский сектор экономики. Анализ зарубежного опыта показал, что частные компании широко привлекаются рядом государств для решения части инфраструктурных задач в военной сфере. В США, частные компании обеспечивают связь и оказывают другие информационные услуги силовым государственным структурам, что дает возможность развития частного бизнеса с одной стороны и экономию бюджетных расходов с другой. Анализ отечественного опыта показал, что использование военных технологий для производства гражданской продукции и услуг в ряде случаев, позволяет значительно экономить время и другие ресурсы. Разработана модель взаимодействия гражданских компаний с оборонным комплексом и модель диффузии военных технологий. Предложено создание новых структур, решающих задачи адаптации военных технологий к требованиям гражданских заказчиков, а также базы данных адаптированных технологий и технического инвестиционного центра, оказывающего поддержку предприятиям малого и среднего бизнеса в приобретении оборудования и технической документации. Авторы считают, что предложенные в статье подходы к решению проблемы трансферта технологий позволят стимулировать инновационную активность в стране, снизят импортозависимость и повысят эффективность бюджетных расходов
-
Вероятностно-статистические модели корреляции и регрессии
08.00.13 Математические и инструментальные методы экономики (экономические науки)
Краткое описаниеКоэффициенты корреляции и детерминации широко используются при статистическом анализе данных. Согласно теории измерений линейный парный коэффициент корреляции Пирсона применим к переменным, измеренным в шкале интервалов. Его нельзя использовать при анализе порядковых данных. Непараметрические ранговые коэффициенты Спирмена и Кендалла оценивают связь порядковых переменных. Критическое значение при проверке значимости отличия коэффициента корреляции от 0 зависит от объема выборки. Поэтому использование "шкалы Чеддока" некорректно. При применении пассивного эксперимента коэффициенты корреляции обоснованно использовать для прогнозирования, но не для управления. Для получения предназначенных для управления вероятностно-статистических моделей необходим активный эксперимент. Влияние выбросов на коэффициент корреляции Пирсона весьма велико. При увеличении числа проанализированных наборов предикторов заметно растет максимальный из соответствующих коэффициентов корреляции - показателей качества приближения (эффект «вздувания» коэффициента корреляции). Рассмотрены четыре основные модели регрессионного анализа. Выделены модели метода наименьших квадратов с детерминированной независимой переменной. Распределение отклонений произвольно, однако для получения предельных распределений оценок параметров и регрессионной зависимости предполагаем выполнение условий центральной предельной теоремы. Второй тип моделей основан на выборке случайных векторов. Зависимость является непараметрической, распределение двумерного вектора - произвольным. Об оценке дисперсии независимой переменной можно говорить только в модели на основе выборки случайных векторов, равно как и о коэффициенте детерминации как критерии качества модели. Обсуждается сглаживание временных рядов. Рассмотрены методы восстановления зависимостей в пространствах общей природы. Показано, что предельное распределение естественной оценки размерности модели является геометрическим, а построение информативного подмножества признаков наталкивается на эффект "вздувания коэффициентов корреляции". Обсуждаются различные подходы к регрессионному анализ интервальных данных. Анализ многообразия моделей регрессионного анализа приводит к выводу, что не существует единой "стандартной модели"