Численные методы обучения по прецедентам (практика, В.В. Стрижов)

Описание курса и расписание студенческих работ находятся на сайте Machinelearning.ru.

Matching entries: 0
settings...

2015

Адуенко А.А., Рудаков К.В., Рейер И.А, Василейский А.С., Карелов А.И., Стрижов В.В. Алгоритмы выделения и совмещения устойчивых отражателей на спутниковых снимках // Компьютерная оптика, 2015, 39(4) — 622-630. Article
Abstract: Для решения задачи выделения малых (со скоростями до единиц сантиметров в год и менее) движений земной поверхности с помощью методов SAR-интерферометрии, необходимо выделить некоторое множество участков земной поверхности, которые остаются ко-герентными на радиолокационных снимках в течение длительного времени. Такие участки и соответствующие им точки на снимках называются устойчивыми отражателями. В данной работе рассмотрены два метода выделения устойчивых отражателей. Рассматриваемые методы сравниваются по количеству выделяемых точек и по их средней временной когерентности. Рассматриваемые алгоритмы проиллюстрированы на примере обработки набора из 35 радиолокационных снимков.
BibTeX:
@article{Адуенко2015,
  author = {Адуенко, А.А. and Рудаков, К.В. and Рейер, И.А. and Василейский, А.С. and Карелов, А.И. and Стрижов, В.В.},
  title = {Алгоритмы выделения и совмещения устойчивых отражателей на спутниковых снимках},
  journal = {Компьютерная оптика},
  year = {2015},
  volume = {39},
  number = {4},
  pages = {622-630},
  url = {http://strijov.com/papers/Aduenko2015PSdetection.pdf},
  doi = {10.18287/0134-2452-2015-39-4-622-630}
}
Газизуллина Р.К., Стенина М.М., Стрижов В.В. Прогнозирование объемов железнодорожных грузоперевозок по парам веток // Системы и средства информатики, 2015, 25(1) — 144-157. Article
Abstract: Работа посвящена исследованию алгоритма непараметрического прогнозирования объемов железнодорожных грузоперевозок. Решается задача прогнозирования количества вагонов с различными грузами, следующих по различным маршрутам. Задана топология железнодорожной сети - для всех возможных пар железнодорожных веток дана информация о всех блоках вагонов, совершивших переезд с одной ветки на другую, включая количество вагонов в блоке, вид груза и дату прохождения маршрута. Для построения прогноза используется алгоритм, основанный на свертке эмпирической плотности распределения значений временного ряда с функцией потерь. Ранее прогноз выполнялся для каждого железнодорожного узла в отдельности. Предлагается повысить качество прогноза за счет прогнозирования по парам веток вместо прогнозирования отправления всех вагонов с данного узла. Алгоритм проиллюстрирован посуточными данными за полтора года о перевозках 38 типов грузов.
BibTeX:
@article{,
  author = {Газизуллина, Р.К. and Стенина, М.М. and Стрижов, В.В.},
  title = {Прогнозирование объемов железнодорожных грузоперевозок по парам веток},
  journal = {Системы и средства информатики},
  year = {2015},
  volume = {25},
  number = {1},
  pages = {144-157},
  url = {http://strijov.com/papers/Gazizullina2014RailwayForecasting.pdf},
  doi = {10.14357/08696527150109}
}
Гончаров А., Попова М., Стрижов В. Метрическая классификация временных рядов с выравниванием относительно центроидов классов // Системы и средства информатики, 2015, 4. Article
Abstract: В работе рассматривается задача многоклассовой классификации временных рядов. Классификация производится с помощью метрических методов, использующих матрицу попарных расстояний между временными рядами. Вычисление такой матрицы является трудоемким, так как ее размерность равна числу объектов выборки. С целью снижения размерности предлагается предварительно выделять эталонные объекты, а именно центроиды каждого класса, и строить матрицу попарных расстояний между объектами выборки и эталонными объектами классов. Для вычисления попарных расстояний между объектами предлагается использовать метод динамического выравнивания временных рядов. В качестве прикладной задачи рассматривается задача распознавания типа движения по данным акселерометра мобильного телефона. Метрический алгоритм классификации, исследованный в этой работе, сравнивается с алгоритмом разделяющей классификации.
BibTeX:
@article{Гончаров2015,
  author = {Гончаров, А.В. and Попова, М.С. and Стрижов, В.В.},
  title = {Метрическая классификация временных рядов с выравниванием относительно центроидов классов},
  journal = {Системы и средства информатики},
  year = {2015},
  volume = {4},
  url = {http://strijov.com/papers/Goncharov2015MetricClassification.pdf}
}
Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015 — 1-14. Article
Abstract: The current generation of portable mobile devices incorporates various types of sensors that open up new areas for the analysis of human behavior. In this paper, we propose a method for human physical activity recognition using time series, collected from a single tri-axial accelerometer of a smartphone. Primarily, the method solves a problem of time series segmentation, assuming that each meaningful segment corresponds to one fundamental period of motion. To extract the fundamental period we construct the phase trajectory matrix, applying the technique of principal component analysis. The obtained segments refer to various types of human physical activity. To recognize these activities we use the k-nearest neighbor algorithm and neural network as an alternative. We verify the accuracy of the proposed algorithms by testing them on the WISDM dataset of labeled accelerometer time series from thirteen users. The results show that our method achieves high precision, ensuring nearly 96% recognition accuracy when using the bunch of segmentation and k-nearest neighbor algorithms.
BibTeX:
@article{Ignatov2015,
  author = {Ignatov, A. and Strijov, V.},
  title = {Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer},
  journal = {Multimedia Tools and Applications},
  year = {2015},
  pages = {1-14},
  url = {http://strijov.com/papers/Ignatov2015HumanActivity.pdf},
  doi = {10.1007/s11042-015-2643-0}
}
Катруца А.М., Стрижов В.В. Проблема мультиколлинеарности при выборе признаков в регрессионных задачах // Информационные технологии, 2015, 1 — 8-18. Article
Abstract: В данной работе исследуется проблема мультиколлинеарности и её влияние на эффективность методов выбора признаков. Предлагается процедура тестирования методов выбора признаков и методика порождения тестовых выборок с различными типами мультиколлинеарности между признаками. Рассматриваемые методы выбора признаков тестируются на порождённых выборках. Процедура тестирования заключается в применении методов выбора признаков к выборкам с различным типом мультиколлинеарности и оценивании количества мультиколлинеарных признаков в множестве отобранных признаков. В работе приводится критерий сравнения методов выбора признаков. Методы выбора признаков сравниваются согласно различным функционалам качества. Проведено сравнение методов выбора признаков для случая наличия в данных определённого типа мультиколлинеарности. Сделан вывод о качестве работы рассматриваемых методов на определённых типах данных.
BibTeX:
@article{Катруца2015,
  author = {Катруца, А.М. and Стрижов, В.В.},
  title = {Проблема мультиколлинеарности при выборе признаков в регрессионных задачах},
  journal = {Информационные технологии},
  year = {2015},
  volume = {1},
  pages = {8-18},
  url = {http://strijov.com/papers/Katrutsa2014TestGeneration.pdf}
}
Katrutsa A., Kuznetsov M., Rudakov K., Strijov V. Metric concentration search procedure using reduced matrix of pairwise distances // Intelligent Data Analysis, 2015, 19(5) — 1091-1108. Article
Abstract: This paper presents a new fast clustering algorithm RhoNet, based on the metric concenration location procedure. To locate the metric concentration, the algorithm uses a reduced matrix of pairwise ranks distances. The key feature of the proposed algorithm is that it doesn't need the exhaustive matrix of pairwise distances. This feature reduces computational complexity. It is designed to solve the protein secondary structure recognition problem. The computational experiment collects tests and to hold performance analysis and analysis of dependency for the algorithm quality and structure parameters. The algorithm is compared with k-modes and tested on different metrics and data sets.
BibTeX:
@article{Katrutsa2015,
  author = {Katrutsa, A.M. and Kuznetsov, M.P. and Rudakov, K.V. and Strijov, V.V.},
  title = {Metric concentration search procedure using reduced matrix of pairwise distances},
  journal = {Intelligent Data Analysis},
  year = {2015},
  volume = {19},
  number = {5},
  pages = {1091-1108},
  url = {http://strijov.com/papers/Katrutsa2014RhoNetClustering.pdf},
  doi = {10.3233/IDA-150760}
}
Katrutsa A., Strijov V. Stresstest procedure for feature selection algorithms // Chemometrics and Intelligent Laboratory Systems, 2015, 142 — 172-183. Article
Abstract: This study investigates the multicollinearity problem and the performance of feature selection methods in case of datasets have multicollinear features. We propose a stresstest procedure for a set of feature selection methods. This procedure generates test data sets with various configurations of the target vector and features. A number of some multicollinear features are inserted in every configuration. A feature selection method results a set of selected features for given test data set. To compare given feature selection methods the procedure uses several quality measures. A criterion of the selected features redundancy is proposed. This criterion estimates number of multicollinear features among the selected ones. To detect multicollinearity it uses the eigensystem of the parameter covariance matrix. In computational experiments we consider the following illustrative methods: Lasso, ElasticNet, LARS, Ridge and Stepwise and determine the best one, which solve the multicollinearity problem for every considered configuration of dataset.
BibTeX:
@article{Katrutsa2015a,
  author = {Katrutsa, A.M. and Strijov, V.V.},
  title = {Stresstest procedure for feature selection algorithms},
  journal = {Chemometrics and Intelligent Laboratory Systems},
  year = {2015},
  volume = {142},
  pages = {172-183},
  url = {http://strijov.com/papers/Katrutsa2014TestGenerationEn.pdf},
  doi = {10.1016/j.chemolab.2015.01.018}
}
Kuznetsov M., Clasel M., Amini M.-R., Gaussier, E. and Strijov V.V. Supervised topic classification for modeling a hierarchical conference structure // International Conference on Neural Information Processing, 2015 — 90-97. Article
Abstract: In this paper we investigate the problem of supervised latent modelling for extracting topic hierarchies from data. The supervised part is given in the form of expert information over document-topic correspondence. To exploit the expert information we use a regularization term that penalizes the di erence between a predicted and an expertgiven model. We hence add the regularization term to the log-likelihood function and use a stochastic EM based algorithm for parameter estimation. The proposed method is used to construct a topic hierarchy over the proceedings of the European Conference on Operational Research and helps to automatize the abstract submission system.
BibTeX:
@article{Kuznetsov2015,
  author = {Kuznetsov, M.P. and Clasel, M. and Amini, M.-R. and Gaussier, E. and Strijov, V.V.},
  title = {Supervised topic classification for modeling a hierarchical conference structure},
  journal = {International Conference on Neural Information Processing},
  year = {2015},
  pages = {90-97},
  url = {http://strijov.com/papers/TopicModelsICONIP2015.pdf}
}
Kuznetsov M.P., Tokmakova A.A., Strijov V.V. Analytic and stochastic methods of structure parameter estimation // Informatica, 2015. Article
Abstract: The paper presents analytic and stochastic methods of structure parameters estimation for model selection. Structure parameters are covariance matrices of parameters of linear and non-linear regression models. To optimize the model parameters and the structure parameters we maximize the model evidence including the data likelihood and the prior parameter distribution. The analytic methods are based on the approximated model evidence derivatives computation. The stochastic methods are based on the model parameters sampling and data cross-validation. The proposed methods are tested and compared on synthetic and real data.
BibTeX:
@article{Kuznetsov2015a,
  author = {Kuznetsov, M.P. and Tokmakova, A.A. and Strijov, V.V.},
  title = {Analytic and stochastic methods of structure parameter estimation},
  journal = {Informatica},
  year = {2015},
  url = {http://strijov.com/papers/HyperOptimizationEng.pdf}
}
Motrenko A., Strijov V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2015. Article
Abstract: We address the problem of segmenting nearly periodic time series into period-like segments. We introduce a definition of nearly periodic time series via triplets hbasic shape, shape transformation, time scalingi that covers a wide range of time series. To split the time series into periods we select a
pair of principal components of the Hankel matrix. We then cut the trajectory of the selected principal components by its symmetry axis, thus obtaining half-periods that are merged into segments.We describe a method of automatic selection of periodic pairs of principal components, corresponding to the fundamental periodicity.
We demonstrate the application of the proposed method to the problem of period extraction for accelerometric time series of human gait. We see the automatic segmentation into periods
as a problem of major importance for human activity recognition problem, since it allows to obtain interpretable segments: each extracted period can be seen as an ultimate entity of gait.
The method we propose is more general compared to the application specific methods and can be used for any nearly periodical time series. We compare its performance to classical
mathematical methods of period extraction and find that it is not only comparable to the alternatives, but in some cases performs better.
BibTeX:
@article{Motrenko2015,
  author = {Motrenko, A.P. and Strijov, V.V.},
  title = {Extracting fundamental periods to segment human motion time series},
  journal = {Journal of Biomedical and Health Informatics},
  year = {2015},
  url = {http://strijov.com/papers/Motrenko2014TSS_eng.pdf},
  doi = {10.1109/JBHI.2015.2466440}
}
Попова М., Стрижов В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информатика и ее применения, 2015, 9(1) — 79-89. Article
Abstract: В данной работе решается проблема построения оптимальных устойчивых моделей в задаче классификации физической активности человека. Каждый тип физической активности конкретного человека описывается набором признаков, сгенерированных по временным рядам с акселерометра. В условиях мультиколлинеарности признаков выбор устойчивых моделей классификации затруднен из-за необходимости оценки большого числа параметров этих моделей. Оценка оптимального значения параметров также затруднена в связи с тем, что функция ошибок имеет большое количество локальных минимумов в пространстве параметров. В работе исследуются модели, принадлежащие классу двуслойных нейронных сетей. Ставится задача нахождения Парето оптимального фронта на множестве допустимых моделей. Предлагаются критерии оптимального, последовательного и устойчивого прореживания нейронной сети, критерий наращивания сети, а также строится стратегия пошаговой модификации модели с использованием предложенных критериев. В вычислительном эксперименте модели, порождаемые предложенной стратегией, сравниваются по трем критериям качества -- сложность, точность и устойчивость.
BibTeX:
@article{Попова2015,
  author = {Попова, М.С. and Стрижов, В.В.},
  title = {Выбор оптимальной модели классификации физической активности по измерениям акселерометра},
  journal = {Информатика и ее применения},
  year = {2015},
  volume = {9},
  number = {1},
  pages = {79-89},
  url = {http://strijov.com/papers/Popova2014OptimalModelSelection.pdf}
}
Попова М.С., Стрижов В. Построение сетей глубокого обучения для классификации временных рядов // Системы и средства информатики, 2015, 25(3) — 60-77. Article
Abstract: Данная работа посвящена решению задачи классификации временных рядов с использованием нейронных сетей глубокого обучения. В работе предлагается использовать многоуровневую суперпозицию моделей, принадлежащих следующим классам нейронных сетей: двухслойные нейронные сети, машины Больцмана и автокодировщики. Нижние уровни суперпозиции выделяют из зашумленных данных высокой размерности информативные признаки, а верхний уровень суперпозиции по этим признакам решает задачу классификации. Предложенная модель была протестирована на двух выборках временных рядов физической активности человека. Результаты классификации, полученные предлагаемой моделью в ходе вычислительного эксперимента, сравнивались с результатами, которые были получены на этих же данных в работах зарубежных авторов. Исследование показало возможность применения нейронных сетей глубокого обучения к решению прикладных задач классификации физической активности человека.
BibTeX:
@article{Попова2015a,
  author = {Попова, М. С. and Стрижов, В.В.},
  title = {Построение сетей глубокого обучения для классификации временных рядов},
  journal = {Системы и средства информатики},
  year = {2015},
  volume = {25},
  number = {3},
  pages = {60-77},
  url = {http://strijov.com/papers/PopovaStrijov2015DeepLearning.pdf}
}
Stenina M.M., Kuznetsov M.P., Strijov V.V. Ordinal classification using Pareto fronts // Expert Systems with Applications, 2015, 42(14) — 5947–5953. Article
Abstract: We solve an instance ranking problem using ordinal scaled expert estimations. The experts define a preference binary relation on the set of features. The instance ranking problem is considered as the monotone multiclass classification problem. To solve the problem we use a set of Pareto optimal fronts. The proposed method is illustrated with the problem of categorization of the IUCN Red List threatened species.
BibTeX:
@article{Stenina2015,
  author = {Stenina, M.M. and Kuznetsov, M.P. and Strijov, V.V.},
  title = {Ordinal classification using Pareto fronts},
  journal = {Expert Systems with Applications},
  year = {2015},
  volume = {42},
  number = {14},
  pages = {5947–5953},
  url = {http://strijov.com/papers/Medvednikova2014POF.pdf},
  doi = {10.1016/j.eswa.2015.03.021}
}
Стенина М.М. , Стрижов В.В. Согласование прогнозов при решении задач прогнозирования иерархических временных рядов // Информатика и ее применения, 2015, 9(2) — 77-89. Article
Abstract: Рассматривается задача одновременного прогнозирования набора временных рядов, объединенных в иерархическую многоуровневую структуру. Требуется, чтобы полученные прогнозы удовлетворяли физическим ограничениям и структуре иерархии. В статье предлагается алгоритм согласования прогнозов иерархических временных рядов GTOp (Game-theoretically optimal reconciliation), гарантирующий неухудшение качества прогнозов после проведения процедуры согласования по сравнению с качеством прогнозов, полученных для каждого временного ряда независимо. Подход базируется на поиске равновесия Нэша в антагонистической игре заданного вида и сводит задачу согласования прогнозов к задаче оптимизации с ограничениями типа равенства и неравенства. Доказывается, что при выполнении ряда общих предположений о свойствах структуры иерархии, физических ограничений и функции потерь в игре существует равновесие Нэша в чистых стратегиях. Работа алгоритма демонстрируется на разных типах иерархических структур с использованием данных посуточной загруженности железнодорожных узлов.
BibTeX:
@article{Стенина2015,
  author = {Стенина, М.М. and Стрижов, В.В.},
  title = {Согласование прогнозов при решении задач прогнозирования иерархических временных рядов},
  journal = {Информатика и ее применения},
  year = {2015},
  volume = {9},
  number = {2},
  pages = {77-89},
  url = {http://strijov.com/papers/Stenina2014Reconciliation.pdf},
  doi = {10.14357/19922264150209}
}

2014

Aduenko A., Strijov V. Multimodelling and Object Selection for Banking Credit Scoring // Conference of the International Federation of Operational Research Societies, 2014 — 138. Inproceedings
Abstract: To construct a bank credit scoring model one must select a set of informative objects (client records) to get the unbiased estimation of the model parameters. This set must have no outliers. The authors propose an object selection algorithm for mixture of regression models. It is based on analysis of the covariance matrix for the parameters estimations. The computational experiment shows statistical significance of the classification quality improvement. The algorithm is illustrated with the cash loans and heart disease data sets.
BibTeX:
@inproceedings{AduenkoStrijov2014,
  author = {Aduenko, A.A. and Strijov, V.V.},
  title = {Multimodelling and Object Selection for Banking Credit Scoring},
  booktitle = {Conference of the International Federation of Operational Research Societies},
  year = {2014},
  pages = {138},
  url = {http://strijov.com/papers/Aduenko_Katrutsa2014MultomodelingMulticollinear_IFORS.pdf}
}
Бахтеев О., Стрижов В.В. Восстановление панельной матрицы и ранжирующей модели по метризованной выборке в разнородных шкалах, 2014. Article
Abstract: Работа посвящена восстановлению ежегодных изменений рейтингов студентов при собеседовании в учебный центр. Рассматривается выборка, состоящая из экспертных оценок студентов, проходивших собеседование в учебный центр в течение нескольких лет и итоговых рейтингов студентов. Шкалы экспертных оценок меняются из года в год, но шкала рейтингов остается неизменной. Требуется восстановить ранжирующую модель, не зависящую от времени. Задача сводится к восстановлению панельной матрицы (то есть матрицы объект--признак--год), ставящей во взаимное соответствие некоторого студента (или усредненный ``портрет'' студента) и его предполагаемую оценку на собеседованиях за каждый год, и исследованию ранжирующей модели, полученной на основе этой матрицы, а так же анализу ее устойчивости на протяжении нескольких лет. Предлагается метод восстановления панельной матрицы, основанный на решении многомерной задачи о назначениях. В качестве метода восстановления ранжирующей модели используется алгоритм многоклассовой классификации с отношением полного порядка на классах.
BibTeX:
@article{Bakhteev2014,
  author = {О.Ю. Бахтеев and В. В. Стрижов},
  title = {Восстановление панельной матрицы и ранжирующей модели по метризованной выборке в разнородных шкалах},
  year = {2014},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group074/Bakhteev014UniversityRanking/doc/BakhteevReport.pdf}
}
Варфоломеева А., Стрижов В. Алгоритм разметки библиографических списков методами структурного обучения // Информационные технологии, 2014, 7(1) — 11-15. Article
Abstract: В предлагаемой работе решается прикладная задача сегментации структурированных текстов: для каждого сегмента библиографической записи определяется его тип поля в формате BibTeX. Также для каждой записи определяется тип ее библиографического описания. Такая задача возникает в связи с наличием различных стандартов составления библиографических записей: требуется предложить алгоритм определения типов полей библиографических записей, не зависящий от конкретного стандарта их составления.Для решения задачи определения типа поля в работе предложен метод составления матриц «объектов» и матриц «ответов» – примеров правильной сегментации. В работе предлагается алгоритм разметки библиографических списков методом структурной регрессии, при этом решается задача выбора параметров регрессионной модели. По результатам сегментирования полей записи с помощью кластеризации определяется тип ее библиорафического описания. Качество полученной модели исследуется на наборе неформатированных библиографических списков. В работе показано, что предлагаемый алгоритм имеет хорошее качество сегментации и кластеризации при наличии достаточной обучающей выборки.
BibTeX:
@article{VarfolomeevaStrijov2014,
  author = {Варфоломеева, А.А. and Стрижов, В.В.},
  title = {Алгоритм разметки библиографических списков методами структурного обучения},
  journal = {Информационные технологии},
  year = {2014},
  volume = {7},
  number = {1},
  pages = {11-15},
  url = {http://strijov.com/papers/Varfolomeeva2013StrcLearning.pdf}
}
Гринчук А. Выбор оптимальных структур прогностических моделей методами структурного обучения, 2014. Article
Abstract: Рассматривается задача нахождения оптимальных структур прогностических моделей. Решается задача восстановления структуры модели по историям построения успешных прогнозов. Решается оптимизационная задача выбора параметров модели. Строится прогноз временного ряда методами структурного обучения. Для решения задачи предлагается метод восстановления структур моделей с использованием априорных предположений об этих структурах.
BibTeX:
@article{Grinchul2014,
  author = {Гринчук, А.В.},
  title = {Выбор оптимальных структур прогностических моделей методами структурного обучения},
  year = {2014},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Grinchuk2014StructuredPrediction/doc/Grinchuk2014StructuredPrediction.pdf}
}
Гущин А. Последовательное порождение существенно нелинейных моделей в задачах ранжирования документов, 2014. Article
Abstract: В работе исследуется генетический алгоритм порождения нелинейных суперпозиций набора базовых функций. Предлагается использовать порожденные этим алгоритмом признаки в задачах ранжирования коллекции документов. Изначально имеются такие признаки как частота слова в документе, частота документов с данным словом в коллекции (tf*idf) и подобные. Для решения задачи выполнено пошаговое построение линейной модели с добавлением порожденных признаков.
BibTeX:
@article{Guschin2014,
  author = {Гущин, А.Е.},
  title = {Последовательное порождение существенно нелинейных моделей в задачах ранжирования документов},
  year = {2014},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Guschin2014FeaturesGeneration/doc/Guschin2014FeaturesGeneration.pdf}
}
Ефимова И., Целых В., Воронцов К. Отбор признаков в метрических алгоритмах классификации для дифференциальной диагностики заболеваний по электрокардиограмме // Машинное обучение и анализ данных (готовится к подаче), 2014. Article
Abstract: Рассматривается задача диагностики заболеваний на основе анализа сигналов электрокардиограммы. Исследование состоит в построении метрического алгоритма с отбором признаков для поиска диагностических эталонов. Отбор признаков производится с помощью локально-оптимального алгоритма. На основе построенных эталонов осуществляется классификация различных болезней. Используются данные о шести заболеваниях, которые получены по анализу электрокардиосигналов. Данные о каждом заболевании разбиты на две подгруппы. Первая подгруппа - более надежные специально отобранные случаи. Они используются на этапе обучения алгоритма. Вторая - случаи, когда диагнозы устанавливались врачами менее надежно. Они используются в качестве контрольного множества. Предполагается, что больные пациенты имеют <<схожее>> признаковое описание, <<отличающееся>> от характеристик здоровых. Для формализации понятия <<схожести>> на множестве объектов вводится функция расстояния - взвешенная метрика Минковского, - которая используется в метрическом алгоритме. В результате, построенный алгоритм позволил отобрать информативные признаки для каждой болезни. Исследуется обобщающая способность построенного алгоритма.
BibTeX:
@article{EfimovaCelyh2014,
  author = {Ефимова, И.В. and Целых, В.Р. and Воронцов, К.В.},
  title = {Отбор признаков в метрических алгоритмах классификации для дифференциальной диагностики заболеваний по электрокардиограмме},
  journal = {Машинное обучение и анализ данных (готовится к подаче)},
  year = {2014},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Efimova2014DiagnosticsOfDiseases/doc/Efimova2014DiagnosticsOfDiseases.pdf}
}
Жуков A. Построение рейтингов вузов: панельный анализ и оценка устойчивости, 2014. Article
Abstract: Данная работа посвящена исследованию существующих рейтингов на устойчивость. Для этого вводится критерий устойчивости рейтинга. Описывается метод увеличения устойчивости методики составления рейтинга с помощью монотонных преобразований признаков, используемых при ее составлении. Вычислительный эксперимент использует данные 40 университетов за 2006-2010 гг.
BibTeX:
@article{Zhukov2014,
  author = {Жуков, A.А.},
  title = {Построение рейтингов вузов: панельный анализ и оценка устойчивости},
  year = {2014},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Zhukov2014UniversityRanking/doc/Zhukov2014UniversityRanking.pdf}
}
Карасиков М.Е., Максимов Ю.В. Поиск эффективных методов снижения размерности при решении задач многоклассовой классификации путем её сведения к решению бинарных задач // Машинное обучение и анализ данных, 2014, 1(8 (Принято в печать)). Article
Abstract: Работа посвящена задаче многоклассовой классификации высокой размерности. Рассмот-
рены способы решения задачи многоклассовой классификации на основе сведения её к за-
дачам бинарной классификации. Предложены пути повышения производительности клас-
сификаторов путем снижения размерности пространства признаков методом случайных
проекций. Исследованы различные подходы к сведению задачи многоклассовой класси-
фикации к задачам бинарной классификации и проведено сравнение их эффективностей.
BibTeX:
@article{Karasikov2014,
  author = {Карасиков, М. Е. and Максимов, Ю. В.},
  title = {Поиск эффективных методов снижения размерности при решении задач многоклассовой классификации путем её сведения к решению бинарных задач},
  journal = {Машинное обучение и анализ данных},
  year = {2014},
  volume = {1},
  number = {8 (Принято в печать)},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Karasikov2014SidechainPrediction/doc/Karasikov2014SidechainPrediction.pdf}
}
Катруца А., Стрижов В. Проблема мультиколлинеарности при выборе признаков в регрессионных задачах, 2014. Article
Abstract: В данной работе исследуется проблема мультиколлинеарности и её влияние на эффективность методов выбора признаков. Предлагается процедура тестирования методов выбора признаков и методика порождения тестовых выборок с различными типами мультиколлинеарности между признаками. Рассматриваемые методы выбора признаков тестируются на порождённых выборках. Процедура тестирования заключается в применении методов выбора признаков к выборкам с различным типом мультиколлинеарности и оценивании количества мультиколлинеарных признаков в множестве отобранных признаков. В работе приводится критерий сравнения методов выбора признаков, на котором основана процедура их тестирования. Также методы выбора признаков сравниваются согласно различным функционалам качества. Проведено сравнение методов выбора признаков в случае наличия в данных определённого типа мультиколлинеарности, и сделан вывод о качестве работы рассматриваемых методов на определённых типах данных.
BibTeX:
@article{Katritsa2014,
  author = {А.М. Катруца and В.В. Стрижов},
  title = {Проблема мультиколлинеарности при выборе признаков в регрессионных задачах},
  year = {2014},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group074/Katrutsa2014TestGeneration/doc/Katrutsa2014TestGeneration.pdf}
}
Katrutsa A., Strijov V. Multicollinearity: Performance Analysis of Feature Selection Algorithms // Conference of the International Federation of Operational Research Societies, 2014 — 138. Inproceedings
Abstract: We investigate the multicollinearity problem and its influence on the performance of feature selection methods. The paper proposes the testing procedure for feature selection methods. We discuss the criteria for comparing feature selection methods according to their performance when the multicollinearity is present. Feature selection methods are compared according to the other evaluation measures. We propose the method of generating test data sets with different kinds of multicollinearity. Authors conclude about the performance of feature selection methods if the multicollinearity is present.
BibTeX:
@inproceedings{KatrutsaStijov2014,
  author = {Katrutsa, A.M. and Strijov, V.V.},
  title = {Multicollinearity: Performance Analysis of Feature Selection Algorithms},
  booktitle = {Conference of the International Federation of Operational Research Societies},
  year = {2014},
  pages = {138},
  url = {http://strijov.com/papers/Aduenko_Katrutsa2014MultomodelingMulticollinear_IFORS.pdf}
}
Кулунчаков А., Стрижов В. Обнаружение изоморфных структур существенно нелинейных прогностических моделей // Intelligent Data Analysis (подготовлено к подаче), 2014. Article
Abstract: В данной работе исследуется алгоритм поиска изоморфных подграфов для деревьев, отличный от переборного. Алгоритм позволяет разбивать вершины дерева на классы эквивалентности, индуцированные изоморфизмом поддеревьев с корнями в этих вершинах — корни изоморфных поддеревьев лежат в одном классе. Это позволяет сокращать размерность вектора параметров регрессионной модели, если представлять ее в виде ориентированного дерева и унифицировать параметры в каждой из его изоморфных веток. Также осуществляется замена подграфов дерева суперпозиции на изоморфные им и имеющие меньшую структурную сложность — это позволяет уменьшить структурную сложность всей модели. Оценивается сложность проверки изоморфности двух суперпозиций для предложенного и переборного алгоритмов. Выводится добавка к сложности алгоритма в случае выявления правил замены. По синтетическим данным и данным по биржевым опционам индуктивно порождаются регрессионные модели с помощью алгоритма MVR Composer. Показано уменьшение значения функционала качества этих моделей после упрощения. Демонстрируется неухудшение приближаемости моделью контрольной выборки. Показана вычислительная эффективность предложенного алгоритма в сравнении с исходным для эволюций с достаточной плотностью упрощаемых алгоритмом моделей. Сравнивается доля упрощаемых алгоритмом моделей в эволюции для алгоритма MVR Composer и переборного алгоритма генерирования моделей.
BibTeX:
@article{Kulunchakov2014,
  author = {Кулунчаков, А.С. and Стрижов, В.В.},
  title = {Обнаружение изоморфных структур существенно нелинейных прогностических моделей},
  journal = {Intelligent Data Analysis (подготовлено к подаче)},
  year = {2014},
  url = {http://svn.code.sf.net/p/mlalgorithms/code/Group174/Kulunchakov2014IsomorphicStructures/doc/Kulunchakov2014IsomorphicStructures.pdf?format=raw}
}
Кузьмин А., Адуенко А., Стрижов В. Тематическая классификация тезисов крупной конференции с использованием экспертной модели // Информационные технологии, 2014, 6 — 22-26. Article
Abstract: В работе рассматривается задача тематической верификации тезисов докладов научной конференции. При планировании программы конференции тезисы объединяются в сессии, несколько сессий объединяются в научное направление, а несколько направлений – в область. Такая иерархическая структура называется тематической моделью конференции. На крупные конференции подается несколько тысяч тезисов, а тематическая модель имеет многоуровневую структуру. Программный комитет ежегодно строит тематическую модель конференции. В связи с большим числом экспертов – членов программного комитета, возникает задача проверки целостности построенной экспертной тематической модели. Данная работа посвящена выявлению несоответствий в тематических моделях методами текстовой кластеризации. Рассматривается коллекция тезисов конференции с экспертной тематической моделью. Предполагается, что терминологический состав тезиса определяет его тему и положение в тематической модели. Предлагается функция сходства двух тезисов. Задается функционал качества тематической модели, зависящий от внутрикластерного и межкластерного сходства тезисов. Предлагается быстрый метод неметрической иерархической кластеризации, максимизирующий предложенный функционал качества. Для построения алгоритмической тематической модели вводится параметр значимости экспертной модели. Он определяет значение улучшения функционала качества, при котором структура модели будет изменена. Этот параметр регулирует количество выявляемых тематических противоречий. Алгоритм построения тематической модели проиллюстрирован кластеризацией коллекции тезисов конференции EURO 2013.
BibTeX:
@article{KuminAduenkoStrijov2014,
  author = {Кузьмин, А.А. and Адуенко, А.А. and Стрижов, В.В.},
  title = {Тематическая классификация тезисов крупной конференции с использованием экспертной модели},
  journal = {Информационные технологии},
  year = {2014},
  volume = {6},
  pages = {22-26},
  url = {http://strijov.com/papers/Kuzmin2014Thematic.pdf}
}
Kuzmin A., Aduenko A., Strijov V. Thematic Classification for EURO/IFORS Conference Using Expert Model // Conference of the International Federation of Operational Research Societies, 2014 — 175. Inproceedings
Abstract: The decision support system predicts the areas, streams and sessions for the abstracts of a major conference. Abstract collections from the previous EURO/IFORS (2010, 2012, 2013) conferences and their expert thematic models are considered. The terminological dictionary of the conference and the global thematic model of these collections are constructed. A similarity function between two abstracts is proposed. The non-metric hierarchical clustering algorithm which considers a constructed global thematic model is used to construct the thematic model of a new conference without an expert model.
BibTeX:
@inproceedings{Kuzmin2014,
  author = {Kuzmin, A.A. and Aduenko, A.A. and Strijov, V.V.},
  title = {Thematic Classification for EURO/IFORS Conference Using Expert Model},
  booktitle = {Conference of the International Federation of Operational Research Societies},
  year = {2014},
  pages = {175},
  url = {http://strijov.com/papers/Kuzmin2014Thematic_INFORS.pdf}
}
Kuznetsov M., Strijov V. Partial Orders Combining for the Object Ranking Problem // Conference of the International Federation of Operational Research Societies, 2014 — 157. Inproceedings
Abstract: We propose a new method for the ordinal-scaled object ranking problem. The method is based on the combining of partial orders corresponding to the ordinal features. Every partial order is described with a positive cone in the object space. We construct the solution of the object ranking problem as the projection to a superposition of the cones. To restrict model complexity and prevent overfitting we reduce dimension of the superposition and select most informative features. The proposed method is illustrated with the problem of the IUCN Red List monotonic categorization.
BibTeX:
@inproceedings{Kuznetsov2014,
  author = {Kuznetsov, M.P. and Strijov, V.V.},
  title = {Partial Orders Combining for the Object Ranking Problem},
  booktitle = {Conference of the International Federation of Operational Research Societies},
  year = {2014},
  pages = {157},
  url = {http://strijov.com/papers/Kuznetsov2014PartialOrders_IFORS.pdfs}
}
Kuznetsov M., Strijov V. Methods of expert estimations concordance for integral quality estimation // Expert Systems with Applications, 2014, 41(4) — 1988-1996. Article
Abstract: The paper presents new methods of alternatives ranking using expert estimations and measured data. The methods use expert estimations of objects quality and criteria weights. This expert estimations are changed during the computation. The expert estimation are supposed to be measured in linear and ordinal scales. Each object is described by the set of linear, ordinal or nominal criteria. The constructed object estimations must not contradict both the measured criteria and the expert estimations. The paper presents methods of expert estimations concordance. The expert can correct result of this concordance
BibTeX:
@article{KuznetsovStrijov2014,
  author = {Kuznetsov, M.P. and Strijov, V.V.},
  title = {Methods of expert estimations concordance for integral quality estimation},
  journal = {Expert Systems with Applications},
  year = {2014},
  volume = {41},
  number = {4},
  pages = {1988-1996},
  url = {http://strijov.com/papers/Kuznetsov-Strijov2013Concordance.pdf}
}
Липатова А. Одновременная кластеризация набора временных рядов и соответствующих им прогностических моделей, 2014. Article
Abstract: Рассматривается задача одновременной кластеризации набора временных рядов и прогностических моделей при выборе модели прогнозирования. Вводится понятие структуры связи между рядами, временные ряды исследуются на наличие связей различной структуры. Предполагается наличие первоначальной кластеризации набора временных рядов, основанной на экспертных оценках. Проводится поиск структуры связи, наиболее согласованной со мнением эксперта. Предложен алгоритм одновременной кластеризации набора временных рядов и прогностических моделей на основе расстояний между прогнозами временных рядов.
BibTeX:
@article{Lipatova2014,
  author = {Липатова, А.Н.},
  title = {Одновременная кластеризация набора временных рядов и соответствующих им прогностических моделей},
  year = {2014},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Lipatova2014StructureLearning/doc/Lipatova2014StructureLearning.pdf}
}
Matrosov M., Strijov V. Short-Term Forecasting of Musical Compositions Using Chord Sequences // Conference of the International Federation of Operational Research Societies, 2014 — 229. Inproceedings
Abstract: The objective is to predict a sequence of chords. It is treated as multivariate time series of discrete values. A chord is represented as an array of half-tone sounds within one octave. We utilize a classifier based on probability distributions over chord sequences that are estimated both on a big training set and some revealed part of the forecasted melody. It shows robust forecasting on a set of 50 000 midi files. The novelty is model selection algorithm and invariant representation of chords. The same technique can be used to predict or synthesize various types of discrete time series.
BibTeX:
@inproceedings{Matrosov2014,
  author = {Matrosov, M. and Strijov, V.},
  title = {Short-Term Forecasting of Musical Compositions Using Chord Sequences},
  booktitle = {Conference of the International Federation of Operational Research Societies},
  year = {2014},
  pages = {229},
  url = {http://strijov.com/papers/Matrosov2014Musical_IFORS.pdf}
}
Мотренко А., Стрижов В. Построение агрегированных прогнозов объемов железнодорожных грузоперевозок c использованием расстояния Кульбака-Лейблера // Информатика и ее применения, 2014, 8(2) — 86-97. Article
Abstract: Данное исследование посвящено проблеме построения агрегированных прогнозов объемов железнодорожных грузоперевозок. Для получения агрегированных прогнозов требуется кластеризовать временные ряды таким образом, чтобы распределение временных рядов внутри кластера совпадали. При решении задачи кластеризации требуется оценить близость между временными рядами, исходя из их эмпирических распределений. Вводится критерий принадлежности временных рядов одному распределению, основанный на расстоянии Кульбака-Лейблера между гистограммами временных рядов. Приводится теоретическое и практическое исследование предложенного критерия. Решается задача кластеризации временных рядов на основе матрицы парных расстояний между ними.
BibTeX:
@article{MotrenkoStrijov2014,
  author = {Мотренко, А.П. and Стрижов, В.В.},
  title = {Построение агрегированных прогнозов объемов железнодорожных грузоперевозок c использованием расстояния Кульбака-Лейблера},
  journal = {Информатика и ее применения},
  year = {2014},
  volume = {8},
  number = {2},
  pages = {86-97},
  url = {http://strijov.com/papers/MotrenkoStrijov2014KL.pdf}
}
Motrenko A., Strijov V., Weber G.-W. Bayesian sample size estimation for logistic regression // Journal of Computational and Applied Mathematics, 2014, 255 — 743-752. Article
Abstract: The problem of sample size estimation is important in medical applications, especially in cases of expensive measurements of immune biomarkers. This paper describes the problem of logistic regression analysis with the sample size determination algorithms, namely the methods of univariate statistics, logistics regression, cross-validation and Bayesian inference. The authors, treating the regression model parameters as a multivariate variable, propose to estimate the sample size using the distance between parameter distribution functions on cross-validated data sets. Herewith, the authors give a new contribution to data mining and statistical learning, supported by applied mathematics.
BibTeX:
@article{MotrenkoStrijovWeber2014,
  author = {Motrenko, A. and Strijov, V. and Weber, G.-W.},
  title = {Bayesian sample size estimation for logistic regression},
  journal = {Journal of Computational and Applied Mathematics},
  year = {2014},
  volume = {255},
  pages = {743-752},
  url = {http://strijov.com/papers/MotrenkoStrijovWeber2012SampleSize.pdf},
  doi = {10.1016/j.cam.2013.06.031}
}
Неклюдов К.О. Алгоритм выделения системы ключевых точек на лице человка, 2014. Article
Abstract: В работе исследуется задача распознавания образов на изображении. В частности, исследуется алгоритм поиска графической структуры на изображении. Графической структурой в работе является набор точек на плоскости. Исследуемый алгоритм может быть использован для поиска любых графических структур, но в данной работе рассматривается его применение к задаче выделения ключевых точек на лице человека. Целью работы является оценка качества алгоритма. В работе предложен способ повышения точности алгоритма. Он заключается в предварительной обработке изображений с помощью гауссовской фильтрации. Все количественные оценки качества алгоритма представлены вычислительным экспериментом на реальных данных.
BibTeX:
@article{Nekludov2014,
  author = {Неклюдов, К. О.},
  title = {Алгоритм выделения системы ключевых точек на лице человка},
  year = {2014},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group074/Neklyudov2014FacialKeypointsDetection/doc/Neklyudov2014FacialKeypointsDetection.doc}
}
Перекрестенко Д. Анализ структурной и статистической сложности суперпозиции нейронных сетей, 2014. Article
Abstract: В последнее время нейронные сети с большим количеством скрытых слоев приобретают все большую популярность. В последние пять лет была решена проблема обучения таких сетей. Однако проблема определения оптимальной струкруры сети - числа нейронов и скрытых слоев до сих пор остается открытой. В данной работе исследуется возможность решения этой проблемы методом жадного поиска. Предлагается несколько определений сложности сети и сложности выборки. Предлагается по сложности выборки заранее определять суб-оптимальную сложность сети и искать оптимум в окрестности этой сложности. Предложен алгоритм построения сети суб-оптимальной сложности для заданной задачи классификации. Предложен алгоритм прогнозирования сложности сети по сложности выборки. Качество алгоритма проверяется на задаче классификации временных рядов акселерометра.
BibTeX:
@article{Perekrestenko2014,
  author = {Д.О. Перекрестенко},
  title = {Анализ структурной и статистической сложности суперпозиции нейронных сетей},
  year = {2014},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group074/Perekrestenko2014ComplexityAnalysis/doc/Perekrestenko2014ComplexityAnalysis.pdf}
}
Плавин A. Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания, 2014. Article
Abstract: В работе исследуется возможность автоматического определения оптимального числа тем вероятностной тематической модели. В рамках подхода аддитивной регуляризации тематических моделей предлагается регуляризатор строкового разреживания, позволяющий постепенно сокращать число тем с избыточного начального приближения до оптимального значения. Проводятся вычислительные эксперименты на реалистичных модельных данных, иллюстрирующие устойчивое определение истинного числа тем в модели.
BibTeX:
@article{Plavin2014,
  author = {Плавин, A.В.},
  title = {Оптимизация числа тем в вероятностных тематических моделях с помощью регуляризатора строкового разреживания},
  year = {2014},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Plavin2014TopicsNumberOptimization/doc/Plavin2014TopicsNumberOptimization.pdf}
}
Рыскина М. Регуляризация вероятностных тематических моделей для повышения устойчивости и интерпретируемости, 2014. Article
Abstract: В данной работе предложена новая методика измерения интерпретируемости вероятностных тематических моделей. Предложен функционал, характеризующий интерпретируемость: его вычисление для разных моделей, построенных по одной коллекции документов, требует всего однократного обращения к экспертной разметке. Проверяется гипотеза о том, что регуляризация повышает интерпретируемость и устойчивость модели.
BibTeX:
@article{Ryskina2014,
  author = {Рыскина, М.Н.},
  title = {Регуляризация вероятностных тематических моделей для повышения устойчивости и интерпретируемости},
  year = {2014},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group074/Ryskina2014Interpretability/doc/Ryskina2014Interpretability.doc}
}
Стенина М., Стрижов В. Согласование агрегированных и детализированных прогнозов при решении задач непараметрического прогнозирования // Системы и средства информатики, 2014, 24(2) — 21-34. Article
Abstract: Во многих прикладных областях часто возникают задачи, связанные с прогнозированием большого числа временных рядов, образующих иерархическую структуру. К прогнозам таких рядов как правило предъявляется требование согласованности прогнозов по уровням иерархии. В статье предлагается алгоритм согласования прогнозов иерархических временных рядов, основанный на решении задачи оптимизации с ограничениями. Предлагаемый алгоритм позволяет проводить согласование прогнозов в случае неплоской иерархической структуры, а также учитывать физические ограничения на прогнозируемые величины, такие как неотрицательность или максимальное значение. Работа алгоритма демонстрируется на данных посуточной загруженности железнодорожных узлов в Омской области, качество прогнозов сравнивается с качеством прогнозов алгоритма оптимального согласования. Также демонстрируется работа предлагаемого алгоритма при неплоской иерархической структуре временных рядов.
BibTeX:
@article{SteninaStrijov2014,
  author = {Стенина, М.М. and Стрижов, В.В.},
  title = {Согласование агрегированных и детализированных прогнозов при решении задач непараметрического прогнозирования},
  journal = {Системы и средства информатики},
  year = {2014},
  volume = {24},
  number = {2},
  pages = {21-34},
  url = {http://strijov.com/papers/Stenina2014RailRoadsMatching.pdf}
}
Strijov V., Kuznetsov M., Motrenko A. Structure learning and forecasting model generation // Conference of the International Federation of Operational Research Societies, 2014 — 101. Inproceedings
Abstract: The aim of the study is to suggest a method to forecast a structure of a regression model superposition, which approximates a data set in terms of some quality function. The problem: algorithms of model selection are computationally complex due to the large number of models. The solution: we developed a model structure forecasting algorithm based on previously selected models.
BibTeX:
@inproceedings{Strijov2014,
  author = {Strijov, V.V. and Kuznetsov, M.K. and Motrenko, A.P.},
  title = {Structure learning and forecasting model generation},
  booktitle = {Conference of the International Federation of Operational Research Societies},
  year = {2014},
  pages = {101},
  url = {http://strijov.com/papers/Strijov2014StructLearning_IFORS.pdf}
}
Шинкевич М., Воронцов К. Влияние регуляризаторов разреживания, сглаживания и декорреляции на устойчивость вероятностной тематической модели // Машинное обучение и анализ данных (готовится к подаче), 2014. Article
Abstract: В данной работе изучается проблема устойчивости решения задачи вероятностного тематического моделирования, вызванная неоднозначностью матричного разложения. Для ее решения предлагается использовать подход аддитивной регуляризации тематических моделей. Ранее было показано, что с помощью регуляризаторов разреживания, сглаживания и декорреляции возможно улучшить решение, однако их влияние на устойчивость полученного решения не исследовалось. В данной работе проверяется гипотеза о повышении устойчивости восстановления тематических матриц в регуляризованных тематических моделях. Исследуется оптимальное сочетание регуляризаторов, повышающее устойчивость. Эксперименты производятся на реалистичных модельных данных, удовлетворяющих гипотезам разреженности, слабой коррелированности тем и наличия фоновых тем.
BibTeX:
@article{Shinkevitch2014,
  author = {Шинкевич, М.И. and Воронцов, К.В.},
  title = {Влияние регуляризаторов разреживания, сглаживания и декорреляции на устойчивость вероятностной тематической модели},
  journal = {Машинное обучение и анализ данных (готовится к подаче)},
  year = {2014},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Shinkevich2014RegularizatorsCombination/doc/Shinkevich2014TopicStabilityRegularization.pdf}
}
Швец М. Интерпретация мультимоделей при обработке социологических данных, 2014. Article
Abstract: В работе рассматривается задача кредитного скоринга по анкетным данным клиентов.
Задача имеет ряд особенностей: неполнота и разнородность данных, высокий уровень шума, малые объёмы выборок. На основании оценок, возвращаемых некоторым множеством линейных классификаторов, называемых базовыми, строится результирующий классификатор, который называется мультимоделью. В работе построены две мультимодели: смесь логистических моделей и градиентный бустинг. Мультимодели сравниваются между собой по значению функционала качества.
Выявляются и объясняются сходства и различия полученных решений и выделяется мультимодель, допускающая наименьшее количество ошибок на контроле. Для понимания структуры данных предлагается метод экспертного назначения меток кластеров, называемый интерпретацией. Алгоритмы тестируются на синтетических данных а также на реальных данных по немецким потребительским кредитам.
BibTeX:
@article{Shvets2014,
  author = {М.Ю. Швец},
  title = {Интерпретация мультимоделей при обработке социологических данных},
  year = {2014},
  url = {http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group174/Shvets2014MultimodelInterpretation/doc/Shvets2014MultimodelInterpretation.pdf}
}

2013

Bunakov V. Signature Recognition, 2013. Article
Abstract: Dynamic signature recognition is a method of signature verification using dynamic information about signature: coordinates, pressure, azimuth and inclination of the pen. Users write their signature in a digitizing tablet, which acquires the signature in real time. Compared with static mode in which users write their signature on paper, this method provides more efficient protection against forgery. Techniques applied in this project are Dynamic Time Warping and ROC curve. The data involved is Signature Verification Competition database, therefore obtained results could be compared with those of Competition.
BibTeX:
@article{Bunakov2013SignatureRecognition,
  author = {Bunakov, Vasiliy},
  title = {Signature Recognition},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Bunakov2013SignatureRecognition/doc/Bunakov2013ProblemStatement.pdf}
}
Бырдин А.В. Интерпретация экспертных оценок видов Красной книги РФ путем отбора эталонных объектов, 2013. Article
Abstract: Предложен метод, классифицирующий виды Красной книги РФ. При помощи многоклассовой классификации предложенный метод относит объект в определенный класс и объясняет эксперту результат. В основе метода лежит алгоритм классификации, основанный на вычислении оценок сходства между объектами. Работа проиллюстрирована задачей прогнозирования статуса редких видов, включенных в Красную книгу РФ.
BibTeX:
@article{Byrdin2013RedBook,
  author = {Бырдин, Александр Владимирович},
  title = {Интерпретация экспертных оценок видов Красной книги РФ путем отбора эталонных объектов},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Byrdin2013RedBook/doc/Byrdin2013Red.pdf}
}
Целых В.Р. Статистические критерии адекватности вероятностных тематических моделей коллекции текстовых документов, 2013. Article
Abstract: Тематическое моделирование (topic modeling) --- одно из динамически развивающихся приложений машинного обучения к анализу текстов. Тематическая модель коллекции текстовых документов определяет, к каким темам относится каждый документ, и какие термины образуют каждую тему. Вероятностная тематическая модель описывает каждую тему дискретным распределением на множестве терминов, каждый документ --- дискреным распределением на множестве тем. Это позволяет решать задачи классификации, кластеризации и категоризации текстов, а также создавать тематические поисковые системы, позволяющие по тексту произвольной длины находить документы схожей тематики.
BibTeX:
@article{Celyh2013OptimThem,
  author = {Целых, Влада Руслановна},
  title = {Статистические критерии адекватности вероятностных тематических моделей коллекции текстовых документов},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Celyh2013OptimThem/Celyh2013CheckHyp.pdf}
}
Чинаев Н.Н., Матвеев И.А. Определение точной границы зрачка, 2013. Article
Abstract: Предлагается метод определения точной границы зрачка на монохромном изображении глаза. Метод основан на бинаризации изображения с последующим поиском зрачка как одной из компонент связности. Граница зрачка определяется как граница или часть границы компоненты связности. Для отделения зрачка в случае его объединения в одну компоненту связности с другими объектами, а также для проверки правдоподобия решения используется преобразование Хафа. Приведены статистические результаты, показывающие точность работы метода; в качестве тестовых данных использованы изображения из открытой базы данных.
BibTeX:
@article{Chinaev2013PupilBoundary,
  author = {Чинаев, Николай Николаевич and Матвеев, Иван Алексеевич},
  title = {Определение точной границы зрачка},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Chinaev2013PupilBoundary/doc/Chinaev2013PupilBoundary.pdf}
}
Dubovik A. Classification and Exploring of Source Code (Open Source) of Python Projects, 2013. Article
Abstract: In the past time the interest for exploring, analyzing and operating with results of classified information increases. For that reason, I decided to start observation in that area. It could be implemented, in different ways and forms, but will be united with one common direction which might be expanded.
BibTeX:
@article{Dubovik2013ProjectCodeClassifying,
  author = {Dubovik, Anna},
  title = {Classification and Exploring of Source Code (Open Source) of Python Projects},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Dubovik2013ProjectCodeClassifying/doc/Dubovik2013Systemdocs.doc}
}
Feyzkhanov R. Email filter generation, 2013. Article
Abstract: Labeling email messages is one the main ways to systemize inbox. Manual labeling is very inconvenient. The developed solution solves the problem of manual labeling incoming mail by generating filters which can automatically label messages based on the information of manual labeling. We are using Gmail as inbox and compare different machine learning algorithms for filter generation to find the one which minimizes the number of errors.
BibTeX:
@article{Feyzkhanov2013FilterEmail,
  author = {Feyzkhanov, Rustem},
  title = {Email filter generation},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Feyzkhanov2013FilterEmail/doc/Feyzkhanov2013FilterGenerator.doc}
}
Гринчук О.В. Векторная авторегрессия и управление макроэкономическими показателями, 2013. Article
Abstract: Работа посвящена построению модели краткосрочного прогнозирования макроэкономического состояния Российской Федерации. Решается обратная задача макроэкономического управления, т.е. определение значений управляемых параметров, которые приведут ключевые показатели экономики к желаемому результату за определенное время. В качестве основного инструмента прогнозирования, используется модель векторной авторегрессии, свободной от ограничений структурных моделей (системы одновременных уравнений.)
BibTeX:
@article{Grinchuk2013InverseVAR,
  author = {Гринчук, Олег Валерьевич},
  title = {Векторная авторегрессия и управление макроэкономическими показателями},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Grinchuk2013InverseVAR/doc/Grinchuk2013InverseVAR.pdf}
}
Ибраимова А.З. Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии, 2013. Article
Abstract: Построение адекватных моделей оценки риска невозврата кредита в банковском скоринге снижает финансовые потери. В качестве модели для оценки вероятности риска используется логистичекская регрессия. Работа посвящена совместному выбору наиболее информативных объектов и признаков с помощью генетического алгоритма. В вычислительном эксперименте работа алгоритма проиллюстрирована на данных по потребительским кредитам, также сравнивается работа предложенного алгоритма с другими методами отбора.
BibTeX:
@article{Ibraimova2013ScoringSelection,
  author = {Ибраимова, Айжан Замирбековна},
  title = {Алгоритмы переборного поиска наиболее информативных объектов и признаков в логистической регрессии},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Ibraimova2013ScoringSelection/doc/Ibraimova2013ScoringSelection.pdf}
}
Ivanov A. Detecting Unsolicited SMS Messages, 2013. Article
Abstract: Our research is connected with the problem of detecting unsolicited SMS messages on a smartphone. We use SVM technique for classifying a message as a spam or not-spam message. We combine approaches of analyzing key-word frequencies and word-length analysis for building feature vectors. We build a Matlab classification model, and then we implement a mobile application for Android operating system which uses such a system for filtering and blocking unsolicited SMS messages. We use a database with 6 thousand SMS messages in English for evaluating developed models.
BibTeX:
@article{IvanovA2013DetectingSMSSpam,
  author = {Ivanov, Alexander},
  title = {Detecting Unsolicited SMS Messages},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/IvanovA2013DetectingSMSSpam/doc/IvanovA2013Systemdocs.doc}
}
Kasatkin S. Determination of the type of human activity based on the data from the accelerometer, 2013. Article
BibTeX:
@article{Kasatkin2013Accelerometer,
  author = {Kasatkin, Sergey},
  title = {Determination of the type of human activity based on the data from the accelerometer},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Kasatkin2013Accelerometer/doc/Kasatkin2013Systemdocs.doc}
}
Кащеева М.С. Модель пространства состояний в обратной задаче прогнозирования, 2013. Article
Abstract: В данной работе рассматривается обратная задача макроэкономического прогнозирования, т.е задача определения управляющего воздействия на независимые переменные (индикаторы социально-экономического развития страны). Для определения зависимости используется метод пространства состояний (SSM). В качестве объекта управления строится модель экономики России в форме системы одновременных уравнений. По результатам определяется оптимальный уровень государственного воздействия и анализируется ошибка прогноза. Для иллюстрации используются данные полученные на основе статистических исследований Госкомстат РФ , Reuters и ЦБ России.
BibTeX:
@article{Kashcheeva2013SSM,
  author = {Кащеева, Мария Сергеевна},
  title = {Модель пространства состояний в обратной задаче прогнозирования},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Kashcheeva2013SSM/doc/Kashcheeva2013SSM.pdf}
}
Катруца А.М. Ранжирование поисковой выдачи, 2013. Article
Abstract: Требуется по данному множеству запросов и документов отранжировать документы, соответствующие одному запросу по степени релевантности. Обучающая выборка состоит из признакового описания документов, идентификатора запроса и оценки ассесора. Предлгается использовать логистическую регрессию и отбор признаков для нахождения оценок релевантности.
BibTeX:
@article{Katrutsa2013PageRank,
  author = {Катруца, Александр Михайлович},
  title = {Ранжирование поисковой выдачи},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Katrutsa2013PageRank/doc/Katrutsa2013Systemdocs.doc}
}
Катруца А.М. Сравнение быстрых алгоритмов кластеризации с использованием матрицы парных расстояний в ранговых шкалах, 2013. Article
Abstract: Работа посвящена сравнительному анализу быстрых алгоритмов кластеризации. Рассматриваются два алгоритма: первый, базовый, алгоритм $k$-means, а второй, исследуемый, ранговый алгоритм кластеризации основан на построении $-сети и нахождения метрических сгущений, назовём последний алгоритм ранговым алгоритмом кластеризации. Отличительной особенностью исследуемого алгоритма является то, что не требуется строить полную матрицу парных расстояний, что снижает его сложность. Предложен набор тестов и проанализирована зависимость качества работы рангового алгоритма кластеризации от параметров. Также проведёно сравнение качества работы обоих алгоритмов в зависимости от внутренней структуры выборки. Алгоритмы тестировались на модельных данных и реальных данных из репозитория UCI.
BibTeX:
@article{Katrutsa2013RhoNets,
  author = {Катруца, Александр Михайлович},
  title = {Сравнение быстрых алгоритмов кластеризации с использованием матрицы парных расстояний в ранговых шкалах},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Katrutsa2013RhoNets/doc/Katrutsa2013RhoNets.pdf}
}
Костин А.А. Инвариантные преобразования в задачах локального прогнозирования, 2013. Article
Abstract: В данной работе решается проблема, возникающих в задачах локального прогнозирования, а именно построение прогноза с учетом того, что возможны изменения казалось бы постоянных для периодической функции вещей: значений в точках, отличающихся на период, а также изменения самого периода. Рассматриваются инвариантные преобразования, позволяющие находить функции, аналогичные рассмариваемой. Это нужно для того, чтобы учесть возможные отклонения значений периодической функции и предполагаемого периода от некоего эталона. Исследуется вопрос совмещения алгоритмов локального преобразования времени и амплитуды прогнозируемых временных рядов. Для демонстрации работы алгоритма сравнивается его точность в прогнозе на модельных и реальных данных.
BibTeX:
@article{Kostin2013Invariant4LocalForecast,
  author = {Костин, Александр Александрович},
  title = {Инвариантные преобразования в задачах локального прогнозирования},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Kostin2013Invariant4LocalForecast/doc/Kostin2013Invariant4LocalForecast.pdf}
}
Kotenko Lengold E., Kudriashova A. Satellite imagery processing for NDVI estimation, 2013. Article
Abstract: Normalized Difference Vegetation Index (NDVI) is a useful indicator which allows to assess the relative amount of vegetation on the given areas of land by analyzing satellite imagery in visible light and near-infrared wavelengths. The developed solution solves one of the key problems related to NDVI: errors caused by clouds decrease the value of NDVI for the area under the cloud which distorts the final results making them unreliable. The solution minimizes errors by accumulating the images of the same area for a certain period of time and replacing current NDVI with the largest in the series, thereby providing a more accurate NDVI estimation.
BibTeX:
@article{KotenkoKudryashova2013NDVI,
  author = {Kotenko Lengold, Ekaterina and Kudriashova, Aleksandra},
  title = {Satellite imagery processing for NDVI estimation},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/KotenkoKudryashova2013NDVI/doc/SYSTEMDOC.docx}
}
Кузьмин А.А., Адуенко А.А., Стрижов В.В. Проверка адекватности тематических моделей коллекции документов, 2013. Article
Abstract: Работа посвящена прогнозированию и адаптации иерархической тематической модели коллекции текстов. Рассматриваются коллекции документов со схожими экспертными тематическими моделями. Строится общая тематическая модель для этих коллекций. Методом неметрической кластеризации строится тематическая модель для новой коллекции документов без экспертной модели, использующая в качестве базовой модели построенную общую модель. Выявляются документы, для которых нет подходящего раздела в общей тематической модели. Из этих документов формируются новые разделы общей тематической модели. Проверка качества и адаптивное улучшение построенной модели производится по экспертной кластеризации небольшой группы документов из новой коллекции. Результат работы алгоритма проиллюстрирован построением тематической модели коллекции тезисов конференции EURO 2014 имея данные о экспертных моделях конференций EURO 2009, 2012, 2013.
BibTeX:
@article{KuzminAduenkoStrijov2013AdoptiveTextClustering,
  author = {Кузьмин, Арсентий Александрович and Адуенко, Александр Александрович and Стрижов, Вадим Викторович},
  title = {Проверка адекватности тематических моделей коллекции документов},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/KuzminAduenkoStrijov2013AdoptiveTextClustering/doc/TextClustering.pdf}
}
Кузьмин А.А., Адуенко А.А., Стрижов В.В. Тематическая классификация тезисов крупной конференции с использованием экспертной модели, 2013. Article
Abstract: Работа посвящена определению тем, научных направлений и сессий тезисов конференции. Рассматривается коллекция тезисов конференции с экспертной тематической моделью. Строится терминологический словарь конференции. Предлагается функция сходства двух тезисов. Методом неметрической иерархической кластеризации строится алгоритмическая модель конференции, с заданным весом учитывающая существующую экспертную модель. Выявляются несоответствия между экспертной моделью и предлагаемой. Алгоритм построения тематической модели проиллюстрирован кластеризацией коллекции тезисов конференции EURO 2013.
BibTeX:
@article{KuzminAduenkoStrijov2013HierarchicalClustering,
  author = {Кузьмин, Арсентий Александрович and Адуенко, Александр Александрович and Стрижов, Вадим Викторович},
  title = {Тематическая классификация тезисов крупной конференции с использованием экспертной модели},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/KuzminAduenkoStrijov2013HierarchicalClustering/doc/hierarchicalClustering.pdf}
}
Levdik P. Electricity Prices Forecasting, 2013. Article
Abstract: The problem is to learn how to make a forecast for energy consumption for the future using data about the past. It is useful for those, who work at electricity market.

It is supposed to use LARS (least angle regression). The idea of the algorithm is to compute the most consequential factors with step-by-step changing of their weights to maximize the similitude of forecast with the vector of answers.

We want to learn how to make a forecast and to compute the minimal number of factors.

BibTeX:
@article{Levdik2013Forecasting,
  author = {Levdik, Pavel},
  title = {Electricity Prices Forecasting},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Levdik2013Forecasting/doc/Levdik2013Systemdocs.doc}
}
Matrosov M. Short-term forecasting of musical compositions, 2013. Article
Abstract: This project is devoted to forecasting musical compositions in short-terms, about one tone in advance. The goal is to conduct some research on machine learning technics on functions of discrete arguments and to show that it is possible to do in educational purposes. The main feature of the research is to abstract from the concrete chords and to use feature vector corresponding to a usual music structure like bars and periods. The forecasted melody is also used to get patterns allowing to predict chords more accurately, that is new comparing to the existing methods. Algorithm will be represented with a Matlab program, allowing to train and test on datasets and visualize the results.
BibTeX:
@article{Matrosov2013MusicForecasting,
  author = {Matrosov, Mikhail},
  title = {Short-term forecasting of musical compositions},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Matrosov2013MusicForecasting/doc/Matrosov2013Systemdocs.doc}
}
Митяшов А.А. Обработка сложноорганизованных социологических данных в задаче классификации, 2013. Article
BibTeX:
@article{Mityashov2013ClassificationSocialData,
  author = {Митяшов, Андрей Андреевич},
  title = {Обработка сложноорганизованных социологических данных в задаче классификации},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Mityashov2013ClassificationSocialData/doc/Mityashov2013ClassificationSocialData.doc}
}
Митяшов А.А. Группировка номинальных переменных в задачах банковского кредитного скоринга, 2013. Article
Abstract: Работа посвящена решению проблемы отбора признаков в банковском кредитном скоринге. При заполнении скоринг-карты заемщик может выдать излишнюю информацию, затрудняющую работу скорингового алгоритма. Так возникает проблема отбора информативных признаков и снижения размерности признакового пространства. В работе исследуется задача группировки нескольких признаков в один категориальный. Данные проблемы предлагается решить с помощью генетического алгоритма. Для проверки алгоритма используются исторические данные о потребительских кредитах наличностью за несколько лет.
BibTeX:
@article{Mityashov2013ScoringFeatureSelection,
  author = {Митяшов, Андрей Андреевич},
  title = {Группировка номинальных переменных в задачах банковского кредитного скоринга},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Mityashov2013ScoringFeatureSelection/doc/Mityashov2013ScoringFeatureSelection.pdf}
}
Motrenko A., Strijov V., Weber G.-W. Sample Size Determination for Logistic Regression // Journal of Computational and Applied Mathematics, 2013. Article
Abstract: The problem of sample size estimation is important in medical applications, especially in the cases of expensive measurements of immune biomarkers. This paper describes the problem of logistic regression analysis including model feature selection and includes the sample size determination algorithms, namely methods of univariate statistics, logistics regression, cross-validation and Bayesian inference. The authors, treating the regression model parameters as a multivariate variable, propose to estimate the sample size using the distance between parameter distribution functions on cross-validated data sets. Herewith, the authors give a new contribution to data mining and statistical learning, supported by applied mathematics.
BibTeX:
@article{Motrenko2013JCAM,
  author = {Anastasiya Motrenko and Vadim Strijov and Gerhard-Wilhelm Weber},
  title = {Sample Size Determination for Logistic Regression},
  journal = {Journal of Computational and Applied Mathematics},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Motrenko2013JCAM/MotrenkoStrijovWeber2012SampleSize.pdf}
}
Неклюдов К.О. Facial Keypoints Detection, 2013. Article
Abstract: В работе решается задача нахождения ключевых точек лица человека на изображении. Координаты ключевых точек представляются в виде дерева. Для построения дерева используется минимизация "энергии". "Энергия" вершин и рёбер дерева находятся из распределения вероятностей, параметры которого в свою очередь обучаются из принципа максимального правдоподобия. Координаты точек находятся как аргументы плотностей распределения, на которых функция принимает максимальное значение.
BibTeX:
@article{Neklyudov2013FacialKeypointsDetection,
  author = {Неклюдов, Кирилл Олегович},
  title = {Facial Keypoints Detection},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Neklyudov2013FacialKeypointsDetection/doc/Neklyudov2013Systemdocs.doc}
}
Неклюдов К.О. Моделирование процесса обучения и забывания при оценке качества производства, 2013. Article
Abstract: В работе предложена регрессионная модель, описывающая процесс обучения и забывания группы людей при производстве. Процесс описывается кривой обучения - зависимости длительности производства единицы от количества уже произведённых единиц одним человеком. Необходимо выбрать наиболее подходящий вид кривой обучения из уже существующих и найти её параметры. Основываясь на вычислительном эксперименте по сборке бумажных самолётиков, с помощью анализа регрессионных остатков, выбрана кривая, описывающая процесс наиболее точно. Произведено сравнение моделей на данной выборке.
BibTeX:
@article{Neklyudov2013LearnForget,
  author = {Неклюдов, Кирилл Олегович},
  title = {Моделирование процесса обучения и забывания при оценке качества производства},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Neklyudov2013LearnForget/doc/Neklyudov2013LearnForget.pdf}
}
Перекрестенко Д.О. Human activity recognition, 2013. Article
Abstract: In this paper deep learning methods are applied to accelerometer data and evaluated on movement classification task. Basis features of accelerometer time series are detected by sparse autoencoder. Neural network is optimized by optimal brain damage algorithm. In the experiment deep learning is compared with softmax regression. The algorithms are tested on synthetic and real data.
BibTeX:
@article{Perekrestenko2013Accelerometer,
  author = {Перекрестенко, Дмитрий Олегович},
  title = {Human activity recognition},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Perekrestenko2013Accelerometer/doc/Perekrestenko2013Report.doc}
}
Перекрестенко Д.О. Порождение нейронных сетей с экспертно-заданными функциями активации, 2013. Article
Abstract: В данной работе исследуются возможности нейронных сетей, основанных на различных алгоритмах обучения, в применении к задачам прогнозирования временных рядов. Анализируется алгоритм Deep Learning и его конкуренты - многослойная сеть с градиентным методом обучения и Madaline. В вычислительном эксперименте сравниваются результаты работы нового алгоритма со стандартным методом обучения — градиентным спуском, для одно- двух- и трехслойных нейронных сетей. Работа алгоритмов проилюстрирована на задаче прогнозирования объемов потребления и цен на электроэнергию, а также на синтетических данных. Приведены выводы о целесообразности применения алгоритмов Deep Learning к некоторорым классам задач
BibTeX:
@article{Perekrestenko2013DeepLearning,
  author = {Перекрестенко, Дмитрий Олегович},
  title = {Порождение нейронных сетей с экспертно-заданными функциями активации},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Perekrestenko2013DeepLearning/doc/Perekrestenko2013DeepLearning.pdf}
}
Prilepskiy R. Text location and recognition on Google Street View Images, 2013. Article
Abstract: The problem of text location and recognition on Google Street View images is solved in this paper. Method of finding Extremal Regions (ER) with text is used. Two-steps-classification of ERs is applied. Firstly choosing similar to text ERs is performed. Secondly classification with computationally difficult features is executed. Text locating quality is estimated with a number of correctly recognized text positions.
BibTeX:
@article{Prilepskiy2013GoogleStreetView,
  author = {Prilepskiy, Roman},
  title = {Text location and recognition on Google Street View Images},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Prilepskiy2013GoogleStreetView/doc/Prilepskiy2013GoogleStreetView.doc}
}
Пушняков А.С. Сегментация цветных изображений, 2013. Article
Abstract: В работе решается задача сегментации цветного изображения. Для приближения распределения пикселов по цветам используется модель смеси нормальных распределений. Разделение смеси производится EM алгоритмом с последовательным добавлением компонент. Кластеризация выполняется согласно принципу максимума правдоподобия. Качество сегментации оценивается по величине искажения исходного изображения.
BibTeX:
@article{Pushnyakov2013ImageSegmentation,
  author = {Пушняков, Алексей Сергеевич},
  title = {Сегментация цветных изображений},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Pushnyakov2013ImageSegmentation/doc/Pushnyakov2013Report.doc}
}
Пушняков А.С. Использование спектрального преобразования для распознавания напечатанного изображения, 2013. Article
Abstract: В работе решается задача классификации двух типов изображений глаз: реального и напечатанного. На основании того, что напечатанное изображение, в отличие от реального, содержит периодическую структуру зёрен печати, предлагается использовать спектральное преобразование, выделяющее соответствующую гармонику. Рассматривается зависимость энергии от частоты фурье-спектра, и по ней строится пространство признаков. Задача классификации решается с помощью метрического классификатора.
BibTeX:
@article{Pushnyakov2013SpectrumImage,
  author = {Пушняков, Алексей Сергеевич},
  title = {Использование спектрального преобразования для распознавания напечатанного изображения},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Pushnyakov2013SpectrumImage/doc/Pushnyakov2013SpectrumImage.pdf}
}
Рыскина М.Н. Создание тематической модели на основе PLSA, 2013. Article
Abstract: В данном проекте строится тематическая модель на основе вероятностного латентного семантического анализа. Корпус текстовых документов будет представлен в виде матрицы распределения слов по документам, затем с помощью онлайновой модификации PLSA-EM-алгоритма она будет разложена на матрицы распределения слов по темам и тем по документам. По результатам построения будет создано приложение, определяющее по текстовому фрагменту его тематический профиль.
BibTeX:
@article{Ryskina2013TopicModelPLSA,
  author = {Рыскина, Мария Никитична},
  title = {Создание тематической модели на основе PLSA},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Ryskina2013TopicModelPLSA/doc/Ryskina2013Report.doc}
}
Рыскина М.Н. Разметка библиографических записей с помощью логических алгоритмов, 2013. Article
Abstract: Данная работа посвящена восстановлению библиографических записей в формате BibTeX по их текстовому представлению. Для обработки исходных записей используются регулярные выражения. Извлечённые данные интерпретируются при помощи логических правил, затем оценивается их соответствие запросу. Применяется алгоритм классификации, использующий решающие деревья.
BibTeX:
@article{Ryskina2013Txt2Bib,
  author = {Рыскина, Мария Никитична},
  title = {Разметка библиографических записей с помощью логических алгоритмов},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Ryskina2013Txt2Bib/doc/Ryskina2013Txt2Bib.pdf}
}
Шубин А.В. Обзор алгоритмов упрощения алгебраических выражений, 2013. Article
Abstract: В работе предлагается несколько алгоритмов упрощения алгебраических выражений. Сравниваются характеристики алгоритмов, такие как скорость работы, обьем требуемой памяти, надежность. Рассматриваются особенности различных алгоритмов. Особое внимание уделено алгоритму, где суперпозиция функций представляется в виде направленного ациклического графа с объединением общих поддеревьев. Приводятся результаты вычислительных экспериментов для различных алгоритмов на синтетических данных.
BibTeX:
@article{Shubin2013Simplify,
  author = {Шубин, Андрей Витальевич},
  title = {Обзор алгоритмов упрощения алгебраических выражений},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Shubin2013Simplify/doc/Shubin2013Simplify.pdf}
}
Shuyskiy N. Melody Retrieval at MIDI Database, 2013. Article
Abstract: This project is dedicated to the problem of musical melody recognition using local forecasting algorithm and audio fingerprint conception. The realization of the project is the mobile application that captures played musical composition, analyzes the structure of its melody, predicts the whole audio fingerprint and compares this fingerprint with existing items and the dedicated music database. In case the match is found, the database server will return the information about played composition to the application.
BibTeX:
@article{Shuyskiy2013MelodyRecognition,
  author = {Shuyskiy, Nikolay},
  title = {Melody Retrieval at MIDI Database},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Shuyskiy2013MelodyRecognition/Doc/Shuyskiy2013MelodyRecognition.doc}
}
Стенин С. Определение тематически близких тезисов научной конференции, 2013. Article
Abstract: Ставится задача определения тематически близких тезисов научной конференции.

После успешного решения задачи пользователь получит улучшенный программный продукт для автоматической проверки кластеризации тезисов, что позволит сэкономить время организаторов конференций на сортировку приходящих тезисов.

Документы будут представляться в виде своих тематических профилей, полученных в классических алгоритмах тематического моделирования. Тематические профили будут использоваться в метрических алгоритмах классификации.

Проект будет считаться успешно завершенным, если получится превзойти точность базового алгоритма по заданной мере качества.

BibTeX:
@article{Stenin2013Clustering,
  author = {Стенин, Сергей},
  title = {Определение тематически близких тезисов научной конференции},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Stenin2013Clustering/doc/Stenin2013Report.doc}
}
Токмакова А.А. Алгоритм стохастического отбора объектов и признаков в задаче банковского кредитного скоринга, 2013. Article
Abstract: В работе рассматривается задача совместного отбора информативных признаков и объектов в задаче кредитного скоринга. Для оценки вероятности риска невозврата кредита используется логистическая регрессия. Отбор производится с помощью стохастической процедуры оптимизации. Для снижения размерности признакового пространства решена задача группировки признаков, возникающая в результате бинарного представления порядковых и номинальных признаков. Для повышения качества классификации производится разбиение объектов на группы. Для оценки качества кластеризации предложена модификация ROC-кривой для разбиения множества объектов более, чем на два класса. Вычислительный эксперимент выполнен на исторических данных о потребительских кредитах за несколько последних лет.
BibTeX:
@article{Tokmakova2013Scoring,
  author = {Токмакова, Александра Алексеевна},
  title = {Алгоритм стохастического отбора объектов и признаков в задаче банковского кредитного скоринга},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Tokmakova2013Scoring/doc/Article/Tokmakova2013Scoring.docx}
}
Urzhumtsev O. Similar Conferences Abstract Search, 2013. Article
Abstract: A dictionary is a sorted list of words that are considered most relevant and specific to the topics described and used in the texts. Current work is devoted on automatic creation of dictionary input (i.e. word list) from a collection of texts using topic models (LDA) and subsequent evaluation of the quality of the resulting list.
BibTeX:
@article{Urzhumtsev2013Dictionary,
  author = {Urzhumtsev, Oleg},
  title = {Similar Conferences Abstract Search},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Urzhumtsev2013Dictionary/doc/Urzhumtsev2013Report.doc}
}
Вдовина Е.А. Визуализация матрицы парных расстояний в тематическом моделировании, 2013. Article
Abstract: Рассматривается проблема отображения тезисов конференции на плоскости. Для ее решения предлагается алгоритм визуализации матрицы парных расстояний, основанный на методе главных компонент. Для иллюстрации работы алгоритма проводится вычислительный эксперимент, в котором в качестве входных данных использваны тезисы конференции EURO.
BibTeX:
@article{Vdovina2013DistanceVisualizing,
  author = {Вдовина, Евгения Александровна},
  title = {Визуализация матрицы парных расстояний в тематическом моделировании},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Vdovina2013DistanceVisualizing/doc/Vdovina2013DistanceVisualizing.pdf}
}
Вдовина Е.А. Визуализация текстов и их ключевых слов с помощью трехдольных графов, 2013. Article
Abstract: Имеется коллекция документов с выделенными в них речевыми маркерами. Каждый речевой маркер связан с одной областью знаний (темой). Требуется визуализировать структуру данной коллекции документов. Для этого предлагается использовать метод отжига, градиентный метод оптимизации и treemapping.
BibTeX:
@article{Vdovina2013MappingResultsVisualization,
  author = {Вдовина, Евгения Александровна},
  title = {Визуализация текстов и их ключевых слов с помощью трехдольных графов},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Vdovina2013MappingResultsVisualization/doc/Vdovina2013Report.doc}
}
Воронов С.О. Алгоритм генетического программирования для решения задачи прогнозирования, 2013. Article
Abstract: В работе исследовано автоматическое порождение прогнозирующих моделей. Предложен алгоритм для решения задачи моделирования улыбки волатильности биржевых опционов. В основе алгоритма лежат идеи алгоритмов генетического и аналитического программирования. Проведен вычислительный эксперимент; в нем сравниваются алгоритмы на основе нейронных сетей и генетического программирования с предложенным в статье алгоритмом. Также, в работе проводится исследование алгоритма на наборах тестовых данных.
BibTeX:
@article{Voronov2013GeneticProg,
  author = {Воронов, Сергей Олегович},
  title = {Алгоритм генетического программирования для решения задачи прогнозирования},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Voronov2013GeneticProg/doc/Voronov2013GeneticProg.pdf}
}
Воронов С.О. Распознавание текста на фотографиях, 2013. Article
Abstract: В работе решается задача локализации текста на изображении. Для нахождения символов на изображении производится поиск экстремальных областей (ER). Используется двухстадийная классификация, в первой стадии которой производится отбор наиболее похожих на текст ER. Во второй стадии производится классификация выбранных областей по символам, используя вычислительно сложные признаки. Качество нахождения позиций текста оценивается по количеству правильно локализованных положений.
BibTeX:
@article{Voronov2013TextRecognition,
  author = {Воронов, Сергей Олегович},
  title = {Распознавание текста на фотографиях},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Voronov2013TextRecognition/doc/Voronov2013TextRecognition.docx}
}
Яшков Д.Д. Локализация лиц на фотографии, 2013. Article
Abstract: В работе решается задача локализации лиц на фотографии. Используется интегральное представление изображения, которое позволяет быстро вычислять признаки. Используя представление изображения через признаки, строится ряд слабых классификаторов, каждый из которых содержит ровно один признак, после чего выбираются лучшие признаки. Полученные признаки соединяются группами, последовательно в один большой детектор, который позволяет быстро откинуть области изображения без лиц, тем самым предоставляя возможность тщательного сканирования остальной части изображения.
BibTeX:
@article{Yashkov2013FaceDetection,
  author = {Яшков, Даниил Дмитриевич},
  title = {Локализация лиц на фотографии},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Yashkov2013FaceDetection/doc/Yashkov2013Systemdocs.doc}
}
Яшков Д.Д. Сравнительный анализ алгоритмов выбора признаков: точность, устойчивость, сложность регрессионных моделей, 2013. Article
Abstract: В данной работе анализируются алгоритмы выбора признаков: точность, устойчивость, сложность регрессионных моделей. Для этого строится ряд тестовых задач, на которых проиллюстрировано сравнение.Также предлагается сравнительный алгоритм,основанный на последовательном удалении признаков с помощью метода Белсли. В вычислительном эксперименте предоставлены результаты работы алгоритмов на данных по больным диабетом.
BibTeX:
@article{Yashkov2013FeatureSelection,
  author = {Яшков, Даниил Дмитриевич},
  title = {Сравнительный анализ алгоритмов выбора признаков: точность, устойчивость, сложность регрессионных моделей},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074Spring2013/Yashkov2013FeatureSelection/doc/Yashkov2013FeatureSelection.pdf}
}
Zhelavskaya I. Automatic Filters Generator for Gmail, 2013. Article
Abstract: Labeling email messages is one the main ways to systemize inbox. But labeling messages manually is a long and inconvenient process. This project is devoted to solving the problem of manual labeling of incoming mail by generating filters that automatically label messages based on the information of manual labeling. We use Gmail as a mail client and compare different machine learning algorithms for filter generation to find the one that fit the best (i.e. minimizes the number of errors).
BibTeX:
@article{Zhelavskaya2013FiltersGenerator,
  author = {Zhelavskaya, Irina},
  title = {Automatic Filters Generator for Gmail},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Zhelavskaya2013FiltersGenerator/doc/Zhelavskaya2013Systemdocs.docx}
}
Zhuykov V. Fraud Signature Recognition, 2013. Article
Abstract: Signature recognition is an important research area in the field of authentication of a person as well as documents in e-commerce and banking. We can generally distinguish between two different categories of signature verification systems: online, for which the signature signal is captured during the writing process, thus making the dynamic information available, and offline for which the signature is captured once the writing process is over and thus, only a static image is available.
Dynamic information consist of the following information: coordinate X, coordinate Y, pressure, azimuth, inclination.
A new DTW-based on-line signature verification system and Hidden Markov Models are presented and evaluated. The system is specially designed to operate under realistic conditions, it needs only a small number of genuine signatures to operate and it can be deployed in almost any signature capable capture device. Optimal features sets have been obtained experimentally, in order to adapt the system to environments with different levels of security. The system has been evaluated Signature Verification Competition and its performance is among the best systems reported in the state of the art. Average EERs over these databases lay between 0.41% and 2.16% for random and skilled forgeries respectively.
BibTeX:
@article{Zhuykov2013SignatureRecognition,
  author = {Zhuykov, Vladimir},
  title = {Fraud Signature Recognition},
  year = {2013},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group074/Zhuykov2013SignatureRecognition/doc/Zhuykov2013report.doc}
}

2012

Адуенко А.А., Стрижов В.В. Совместный выбор объектов и признаков в задачах многоклассовой классификации коллекции документов, 2012. Article
Abstract: Работа посвящена задаче ранжирования поисковой выдачи. Для решения этой задачи предложен алгоритм многоклассовой классификации с совместным отбором объектов и признаков, а также его модификация для сравнения релевантности внутри одного класса. Отбор производится двумя способами: с помощью шаговой регрессии и с помощью генетических алгоритмов. Результаты, полученные разными методами, сравниваются. Алгоритм тестируется на синтетических данных и данных поисковой выдачи Яндекса.
BibTeX:
@article{Aduenko2012CovSelection,
  author = {Адуенко, Александр Александрович and Стрижов, Вадим Викторович},
  title = {Совместный выбор объектов и признаков в задачах многоклассовой классификации коллекции документов},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Aduenko2012CovSelection/aduenko_strijov3.pdf}
}
Адуенко А.А. Выбор признаков и шаговая логистическая регрессия для задачи кредитного скоринга, 2012. Article
Abstract: Работа посвящена выбору оптимального набора признаков для определения уровня надежности заемщиков, подавших заявку на банковский кредит. Для ответа на поставленный вопрос оценивается вероятность невозврата кредита. Для отбора признаков используется шаговая регрессия, исследуется зависимость информативности отобранных признаков от параметров шаговой регрессии. В вычислительном эксперименте алгоритм тестируется на данных потребителей, подававших заявки на кредиты в определенный банк, а также на данных об отклике клиентов на маркетинговую кампанию банка.
BibTeX:
@article{Aduenko2012Economics,
  author = {Адуенко, Александр Александрович},
  title = {Выбор признаков и шаговая логистическая регрессия для задачи кредитного скоринга},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Aduenko2012economics/doc/}
}
Адуенко А.А., Стрижов В.В. Визуализация матрицы парных расстояний между документами, 2012. Article
Abstract: В работе рассматривается алгоритм визуализации результатов тематической кластеризации коллекции документов. С помощью метода главных компонент матрица парных расстояний между документами оптимальным способом проецируется на плоскость. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Алгоритм проиллюстрирован примером визуализации тезисов конференции.
BibTeX:
@article{AduenkoStrijov2012TextVisualizing,
  author = {Адуенко, Александр Александрович and Стрижов, Вадим Викторович},
  title = {Визуализация матрицы парных расстояний между документами},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/AduenkoStrijov2012TextVisualizing/aduenko_strijov1.pdf}
}
Адуенко А.А., Стрижов В.В. Алгоритм оптимального расположения названий коллекции документов, 2012. Article
Abstract: В работе исследуется метод визуализации результатов тематической кластеризации коллекции документов. Матрица парных расстояний между документами оптимальным способом спроецирована на плоскость. Требуется расположить названия документов оптимальным образом. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Для ее минимизации использовался алгоритм BFGS. Алгоритм проиллюстрирован примером визуализации тезисов конференции.
BibTeX:
@article{AduenkoStrijov2012TextVisualizingII,
  author = {Адуенко, Александр Александрович and Стрижов, Вадим Викторович},
  title = {Алгоритм оптимального расположения названий коллекции документов},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/AduenkoStrijov2012TextVisualizingII/aduenko_strijov2.pdf}
}
Бочкарева В.Г. Прогнозирование временных рядов с помощью полиномов Чебышёва, 2012. Article
Abstract: В данной работе рассматривается приближение и прогнозирование временных рядов с использованием полиномов Чебышёва первого рода, наименее отклоняющихся от нуля на заданном отрезке. Также вычисляется зависимость среднеквадратичной ошибки от количества полиномов, используемых для приближения.
BibTeX:
@article{Bochkareva2012TimeSeriesPrediction,
  author = {Бочкарева, Валерия Георгиевна},
  title = {Прогнозирование временных рядов с помощью полиномов Чебышёва},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Bochkareva2012TimeSeriesPrediction/Bochkareva2012TimeSeriesPrediction.pdf}
}
Будников Е.А. Оценивание вероятностей появления строк в естественном языке, 2012. Article
Abstract: В работе рассматривается задача оценивания вероятностей появления строк в естественном языке. Для решения задачи используется модель $n$-грамм. Для решения проблемы большого числа параметров используется модель $n$-грамм на классах. Для решения проблемы нулевых вероятностей строк используются три дисконтные модели: Гуда-Тьюринга, Катца и абсолютного дисконтирования.

Введены основные определения и описаны методы, а также алгоритм построения классов в модели $n$-грамм на классах. Описан проведённый эксперимент на синтетических данных.

BibTeX:
@article{Budnikov2012StringsProbabilities,
  author = {Будников, Егор Алексеевич},
  title = {Оценивание вероятностей появления строк в естественном языке},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Budnikov2012StringsProbabilities/docs/Budnikov2012StringsProbabilities.pdf}
}
Бурмистров М.О., Сандуляну Л.Н. Вероятностная модель одноклассовой классификации, 2012. Article
Abstract: Решается задача одноклассовой классификации электронных писем на предмет наличия в них спама. В работе вводится квазивероятностная модель для классической эмпирической постановки задачи одноклассовой классификации и производится сведение классического подхода к новой модели. Построенные методы классификации проверяются вычислительными экспериментами на модельных и реальных данных.
BibTeX:
@article{BurmistrovSanduleanu2012Spam,
  author = {Бурмистров, Михаил Олегович and Сандуляну, Любовь Николаевна},
  title = {Вероятностная модель одноклассовой классификации},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/BurmistrovSanduleanu2012Spam/doc/BurmistrovSanduleanu2012SpamText.pdf}
}
Целых В.Р. Многомерные адаптивные регрессионные сплайны, 2012. Article
Abstract: В работе рассматриваются многомерные адаптивные регрессионные сплайны. Метод позволяет получить модели, дающие достаточно точную аппроксимацию, даже в тех случаях, когда связи между предикторными и зависимыми переменными имеют немонотонный характер и сложны для приближения параметрическими моделями. Экспериментально исследуется зависимость ошибки аппроксимации от сложности модели. Для иллюстрации работы метода используются тестовые данные, данные ЭКГ и данные из области финансовой математики.
BibTeX:
@article{Celyh2012CMARS,
  author = {Целых, Влада Руслановна},
  title = {Многомерные адаптивные регрессионные сплайны},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Celyh2012CMARS/doc/MARS.pdf}
}
Целых В.Р., Воронцов К.В. Критерии согласия для разреженных дискретных распределений и их применение в тематическом моделировании, 2012. Article
Abstract: Критерий согласия Пирсона неприменим к сильно разреженным распределениям, так как в этих случаях распределение статистики плохо описывается асимптотическим законом хи-квадрат, зависит от объёма выборки и вида исходного распределения. В данной работе предлагаются статистические критерии, основанные на вычислении эмпирических распределений статистик путём сэмплирования. Рассматривается их применение в задачах анализа текстов, в частности, для проверки гипотезы условной независимости при построении и оценивании вероятностных тематических моделей.
BibTeX:
@article{Celyh2012SparceDistribution,
  author = {Целых, Влада Руслановна and Воронцов, Константин Вячелавович},
  title = {Критерии согласия для разреженных дискретных распределений и их применение в тематическом моделировании},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Celyh2012SparceDistribution/doc/doc/celyh_vorontsov.pdf}
}
Иванова А.В. Аппроксимация эмпирических функций распределения, 2012. Article
Abstract: На практике нередко встает вопрос о нахождении наиболее вероятного значения некоторой функции. Приближенно можно считать это значение равное математическому ожиданию. Однако для точного вычисления нам необходимо вычислить интеграл, что не всегда удается сделать аналитически. Также в практических задачах обычное имеются значение функции лишь в определенных точках. В данной работе рассматриваются способы упрощения функции для вычисления математического ожидания.
BibTeX:
@article{Ivanova2012ApproximateFunc,
  author = {Иванова, Алина Владиславовна},
  title = {Аппроксимация эмпирических функций распределения},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Ivanova2012ApproximateFunc/Ivanova2012Approximation.dvi}
}
Иванова А.В., Адуенко А.А., Стрижов В.В. Алгоритм построения логических правил при разметке текстов, 2012. Article
Abstract: В работе предложен метод восстановления структуры библиографических записей BibTeX по их текстовому представлению. Структура ищется с помощью логических правил, определенных на экспертно-заданном множестве регулярных выражений. Для построения набора логических правил предполагается использовать алгоритм, основанный на тупиковых матрицах. Предложенный алгоритм проиллюстрирован задачей поиска структуры библиографических записей, представленных набором текстовых строк.
BibTeX:
@article{Ivanova2012LogicStructure,
  author = {Иванова, Алина Владиславовна and Адуенко, Александр Александрович and Стрижов, Вадим Викторович},
  title = {Алгоритм построения логических правил при разметке текстов},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Ivanova2012LogicStructure/Ivanova2012LogicStructure.pdf}
}
Клочков Е.Ю. Прогноз квазипериодических временных рядов непараметрическими методами, 2012. Article
Abstract: В работе рассматривается непараметрический метод прогнозирования квазипериодических временных рядов. В качестве метода используется квантильная регрессия. Его преимущества в том что, несмотря на его простоту, он хорошо приближает многие из известных распределений. Предлагаемый метод тестируется на данных о продажах продуктов.
BibTeX:
@article{Klochkov2012Goods4Cast,
  author = {Клочков, Егор Юрьевич},
  title = {Прогноз квазипериодических временных рядов непараметрическими методами},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Klochkov2012Goods4Cast/docs/Klochkov12Goods4Cast.dvi}
}
Кононенко Д.С. Инвариантные преобразования для прогнозирования временных рядов, 2012. Article
Abstract: Предлагается подход к определению сходства между данными с помощью построения вероятностных параметрических моделей. Рассматривается метрика, основанная на подсчете расстояния Кульбака-Лейблера между вероятностными моделями данных. Также предлагается метод определения сходства между вероятностными моделями данных с помощью выделения инвариантных преобразований. Предложенный метод демонстрируется на задаче тематического моделирования, а именно кластеризации документов и терминов по темам, определяя с помощью поиска инвариантов документы схожей тематики. Используются часто встречаемые в литературе тематические модели PLSA и LDA.
BibTeX:
@article{Kononenko12Invariants,
  author = {Кононенко, Даниил Сергеевич},
  title = {Инвариантные преобразования для прогнозирования временных рядов},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group774/Kononenko2012Invariants/doc/Kononenko2012Invariants/Kononenko12Invariants.pdf}
}
Кузьмин А.А., Стрижов В.В. Проверка адекватности тематических моделей коллекции документов, 2012. Article
Abstract: Рассматривается коллекция документов с экспертной тематической моделью. Для проверки адекватности экспертной модели предлагается построить алгоритмическую модель путем иерархической кластеризации коллекции текстов агломеративным и дивизимным способами. Определяется степень несоответствия экспертной модели и предлагаемой. В работе сравнивается качество моделей, полученных с помощью агломеративного и дивизимного алгоритмов. Визуализируются отличия полученной модели от экспертной.
BibTeX:
@article{Kuzmin2012ThematicClustering,
  author = {Кузьмин, Арсентий Александрович and Стрижов, Вадим Викторович},
  title = {Проверка адекватности тематических моделей коллекции документов},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Kuzmin2012ThematicClustering/kuzmin_strijov.pdf}
}
Кузьмин А.А. Многоуровневая классификация при обнаружении движения цен, 2012. Article
Abstract: В данной работе рассматривается один из возможных методов прогнозирования, основанный на модели логистической регрессии. Предлагается способ разметки пучка временных рядов и построения матрицы объект-признак. Алгоритм проверяется на синтетических пучках временных рядов вида зашумлённых синусов и периодических трапеций. Как вариант практического применения, алгоритм тестируется на данных о потреблении электроэнергии.
BibTeX:
@article{Kuzmin2012TimeRows,
  author = {Кузьмин, Арсентий Александрович},
  title = {Многоуровневая классификация при обнаружении движения цен},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Kuzmin2012TimeRows/doc/Kuzmin2012TimeRows.pdf}
}
Кузьмин А.А., Адуенко А.А., Стрижов В.В. Выбор признаков и оптимизация метрики при кластеризации коллекции документов // Известия Тульского государственного университета. Естественные науки., 2012, 3 — 119–131. Article
Abstract: Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов.
BibTeX:
@article{KuzminAduenkoStrijov2012ThematicClustering,
  author = {Кузьмин, Арсентий Александрович and Адуенко, Александр Александрович and Стрижов, Вадим Викторович},
  title = {Выбор признаков и оптимизация метрики при кластеризации коллекции документов},
  journal = {Известия Тульского государственного университета. Естественные науки.},
  year = {2012},
  volume = {3},
  pages = {119–131},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/KuzminAduenkoStrijov2012ThematicClustering/aduenko_kuzmin_strijov.pdf}
}
Кузнецов М.П. Построение интегрального индикатора в ранговых шкалах с использованием копул для анализа совместного распределения критериев, 2012. Article
Abstract: Предложен метод построения интегрального индикатора на основе критериев, выставленных в ранговых шкалах. Для анализа совместного распределения критериев предложено использовать копулы. Предложен алгоритм выбора признаков, основанный на выборе копулы с наибольшим параметром. Работа проиллюстрирована задачей определения статуса редких видов, включенных в Красную книгу РФ.
BibTeX:
@article{Kuznetsov2012Copula,
  author = {Кузнецов, Михаил Павлович},
  title = {Построение интегрального индикатора в ранговых шкалах с использованием копул для анализа совместного распределения критериев},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group774/Kuznetsov2012Copula/doc/Kuznetsov2012Copula.pdf}
}
Леонтьева Л.Н. Последовательный выбор признаков при восстановлении регрессии, 2012. Article
Abstract: Исследуется проблема оптимальной сложности модели в связи с ее точностью и устойчивостью. Задача состоит в нахождении наиболее информативного набора признаков в условиях их высокой мультиколлинеарности. Для выбора оптимальной модели используется модифицированный алгоритм шаговой регрессии, являющийся одним из алгоритмов добавления и удаления признаков. Для описания работы пошагового алгоритма предложена модель $n$-мерного куба. Проанализированы величины матожидания и дисперсии функции ошибки.
BibTeX:
@article{Leonteva2012n-cube,
  author = {Леонтьева, Любовь Николаевна},
  title = {Последовательный выбор признаков при восстановлении регрессии},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Leonteva2012n-cube/doc/Leonteva2012n-cube.pdf}
}
Лобастов С.Ю. Поиск наиболее информативных признаков путём оптимизации метрики, 2012. Article
Abstract: Работа посвящена решению задачи классификации. Исследование сконцентрировано на построении метрического алгоритма классификации. Построение алгоритма производится путём последовательного добавления признаков в модель с целью максимизации функционала качества модели. Алгоритм проиллюстрирован на примерах синтетических данных и данных диагностирования рака груди.
BibTeX:
@article{Lobastov2012FOSelection,
  author = {Лобастов, Степан Юрьевич},
  title = {Поиск наиболее информативных признаков путём оптимизации метрики},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Lobastov2012FOSelection/Doc/Lobastov2012metric.pdf}
}
Лобастов С.Ю. Проверка адекватности тематической модели, 2012. Article
Abstract: Данная работа посвещена выявлению некорректностей в тематических моделях. В качестве данных берутся тексты тезисов конференции Евро-2012 и их предлагаемая иерархическая тематическая модель. Проводится иерархическая кластеризация текстов методом, берущим за основу алгоритм hHDP, который строит иерархическую модель с фиксированным числом уровней и предлагает несколько вариантов иерархий. Полученные иерархии сравниваются с предлагаемой при помощи венгерского алгоритма.
BibTeX:
@article{Lobastov2012LatentModels,
  author = {Лобастов, Степан Юрьевич},
  title = {Проверка адекватности тематической модели},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Lobastov2012LatentModels/Doc/last/LatentModels.pdf}
}
Медведникова М.М., Стрижов В.В. Построение интегрального индикатора качества научных публикаций методами ко-кластеризации, 2012. Article
Abstract: Предлагается способ измерения качества научных публикаций автора, связанный с качеством журнала, в котором автор печатает свою работу. Рассматриваемый совместный интегральный индикатор вычисляется по спискам публикаций за последние годы, находящимся в открытом доступе, с использованием алгоритма коллаборативной фильтрации. В качестве функционала качества используется функция близости интегральных индикаторов авторов и журналов, в которых они публикуют свои работы. Также оценивается интегрированность авторов и изданий в мировую науку.
BibTeX:
@article{Medvednikova2012CoIndicator,
  author = {Медведникова, Мария Михайловна and Стрижов, Вадим Викторович},
  title = {Построение интегрального индикатора качества научных публикаций методами ко-кластеризации},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Medvednikova2012CoIndicator/doc/medvednikova_strijov.pdf}
}
Медведникова М.М. Использование метода главных компонент при построении интегральных индикаторов, 2012. Article
Abstract: В данной работе рассматривается использование метода главных компонент при построении интегральных индикаторов. Полученные результаты сравниваются с результатами, даваемыми методом расслоения Парето. Строится интегральный индикатор для российских вузов. Для этого используются биографии 30 богатейших бизнесменов России по версии журнала <> за 2011 год.
BibTeX:
@article{Medvednikova2012PCA,
  author = {Медведникова, Мария Михайловна},
  title = {Использование метода главных компонент при построении интегральных индикаторов},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Medvednikova2012PCA/doc/Medvednikova12PCA.pdf}
}
Медведникова М.М., Стрижов В.В., Кузнецов М.П. Алгоритм многоклассовой монотонной Парето-классификации с выбором признаков, 2012. Article
Abstract: Предложен метод нахождения монотонной функции, определенной на декартовом произведении множеств, на которых заданы отношения линейного порядка. В основе метода лежат процедуры монотонизации функции дискретного аргумента и нахождения Парето-оптимального фронта. Рассмотрена задача выбора наиболее информативных признаков. Работа проиллюстрирована задачей прогнозирования статуса редких видов, включенных в Красную книгу РФ.
BibTeX:
@article{Medvednikova2012RedBook,
  author = {Медведникова, Мария Михайловна and Стрижов, Вадим Викторович and Кузнецов, Михаил Павлович},
  title = {Алгоритм многоклассовой монотонной Парето-классификации с выбором признаков},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Medvednikova2012RedBook/doc/monot_class.pdf}
}
Мотренко А.П. Оценка необходимого объема выборки пациентов при прогнозировании сердечно-сосудистых заболеваний, 2012. Article
Abstract: В работе описан алгоритм классификации пациентов, перенесших инфаркт и имеющих предрасположенность к инфаркту. Признаками для определения состояния пациента служат измерения концентрации белков в крови. Решается задача оценки параметров функции регрессии и выбора признаков в логистической регрессии. Предполагается, что объем данных недостаточен, поэтому в работе предлагается способ оценки необходимого объема выборки.
BibTeX:
@article{Motrenko2012SampleSize,
  author = {Мотренко, Анастасия Петровна},
  title = {Оценка необходимого объема выборки пациентов при прогнозировании сердечно-сосудистых заболеваний},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Motrenko2012SampleSize/doc/Motrenko2012SampleSize.pdf}
}
Романенко А.А. Кластеризация коллекции текстов, 2012. Article
Abstract: В работе предлагается метод кластеризации текстовой коллекции с помощью стандартных метрических алгоритмов, например, K-means. Для этого вводится функция расстояния между текстами, учитывающая <<схожесть>> лексики используемой в тексте. В работе также исследуется соответствие между введенным расстоянием на множестве реальных текстов и близостью тематик этих текстов. Возможность кластеризации и соответствие ее результатов с заранее известным распределением текстов по тематике исследована в вычислительном эксперименте на синтетической коллекции текстов.
BibTeX:
@article{Romanenko2012Clustering,
  author = {Романенко, Александр Александрович},
  title = {Кластеризация коллекции текстов},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Romanenko2012Clustering/doc/Romanenko2012Clustering.pdf}
}
Рудой Г.И. Упрощение суперпозиций элементарных функций при помощи преобразований графов по правилам, 2012. Article
Abstract: Предлагается алгоритм упрощения суперпозиций существенно нелинейных регрессионных моделей. Данный алгоритм является усовершенствованием ранее предложенных методов упрощения выражений по правилам. Суперпозиции представляются в виде направленного ациклического графа с объединением общих поддеревьев. Такое представление позволяет существенно расширить класс допустимых преобразований суперпозиций. Доказывается корректность и полнота предложенного алгоритма. Приводятся результаты вычислительного эксперимента для набора синтетических данных.
BibTeX:
@article{Rudoy2012Reduction,
  author = {Рудой, Георгий Игоревич},
  title = {Упрощение суперпозиций элементарных функций при помощи преобразований графов по правилам},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Rudoy2012Reduction/doc/Rudoy2012Reduction.pdf}
}
Шпакова Т.А. Cоставление словаря аминокислотных последовательностей, 2012. Article
Abstract: В данной работе рассматривается задача составления словаря аминокислотных подпоследовательностей. В основе работы лежит алгоритм, использующий процедуру вычисления матрицы парных расстояний между двумя последовательностями аминокислотных остатков. Особенность работы заключается в отсутствии необходимости вычислять полную матрицу парных расстояний, что снижает вычислительную сложность алгоритма. Работу завершает вычислительный эксперимент, который демонстрирует работу алгоритма на конкретной выборке из базы UniProt.
BibTeX:
@article{Shpakova2012Clustering,
  author = {Шпакова, Татьяна Александровна},
  title = {Cоставление словаря аминокислотных последовательностей},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Shpakova2012Clustering/doc_new/Shpakova2012Clustering.pdf}
}
Шульга А.В. Векторная авторегрессия и управление макроэкономическими показателями, 2012. Article
Abstract: Модели векторной авторегрессии (VAR) представляют собой весьма удобный инструмент для одновременного прогнозирования различных временных рядов. Например, актуальной на данный момент является задача прогнозирования и управления макроэкономическими показателями по наблюдаемым данным. Для упрощения вычислений, далее рассматривается простейший метод VAR неструктурного прогнозирования, который состоит в поиске линейной зависимости между прогнозируемой переменной и фиксированного числа лагов для всех временных рядов. Количество лагов равно 4м что соответствует квартальным изменениям макроэкономических параметров.
BibTeX:
@article{Shulga2012VAR,
  author = {Шульга, Александр Вадимович},
  title = {Векторная авторегрессия и управление макроэкономическими показателями},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Shulga2012VAR/doc/shulga_var.pdf}
}
Токмакова А.А., Стрижов В.В. Методы оценки ковариационных матриц в задачах регрессионного анализа, 2012. Article
Abstract: Работа посвящена исследованию алгоритмов оценивания ковариационных матриц параметров регрессионных моделей. Принята гипотеза о том, что зависимая переменная и параметры регрессионной модели — многомерные случайные величины, имеющие нормальное распределение. Считается, что ковариационная матрица распределения зависимой переменной известна и фиксирована. Рассмотрены случаи диагональных ковариационных матриц и матриц общего вида, проводится сравнительный анализ представленных методов. Сравниваются четыре подхода к оценке ковариационной матрицы параметров модели: аппроксимация матрицей, полученной с помощью метода наименьших квадратов; аппроксимация Лапласа; сэмплирование; максимизация правдоподобия модели методом Монте-Карло.
BibTeX:
@article{Tokmakova2012CovarianceEstimation,
  author = {Токмакова, Александра Алексеевна and Стрижов, Вадим Викторович},
  title = {Методы оценки ковариационных матриц в задачах регрессионного анализа},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Tokmakova2012CovarianceEstimation/doc/StrijovTokmakova2012.pdf}
}
Токмакова А.А. Оценивание гиперпараметров регрессионных моделей при отборе шумовых и коррелирующих признаков, 2012. Article
Abstract: В работе решается задача отбора признаков при восстановлении функции регрессии. Принята гипотеза о нормальном распределении вектора зависимой переменной и параметров модели. Для оценки ковариационной матрицы параметров используется аппроксимация Лапласа: логарифм функции ошибки приближается функцией нормального распределения. Исследуется проблема присутствия в выборке шумовых и коррелирующих признаков, так как при их наличии матрица ковариаций параметров модели становится вырожденной. Предлагается алгоритм, производящий отбор информативных признаков. В вычислительном эксперименте приводятся результаты исследования на временном ряде.
BibTeX:
@article{Tokmakova2012HyperPar,
  author = {Токмакова, Александра Алексеевна},
  title = {Оценивание гиперпараметров регрессионных моделей при отборе шумовых и коррелирующих признаков},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Tokmakova2012HyperPar/doc/TokmakovaHyperPar2012.pdf}
}
Цыганова С.В. Локальные методы прогнозирования с выбором преобразования, 2012. Article
Abstract: В работе описан алгоритм локального прогнозирования с учетом преобразований, позволяющий выявить похожие в веденной метрике и с введенной функцией расстояния интервалы временного ряда. Рассмотренно понятие инвариантных преобразований, их обнаружение и выбор наиболее подходящих для решения задачи прогнозирования. Работа алгоритма проиллюстрирована на данных потребления электроэнергии и на синтетических данных.
BibTeX:
@article{Tsyganova2012LocalForecast,
  author = {Цыганова, Светлана Валерьевна},
  title = {Локальные методы прогнозирования с выбором преобразования},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Tsyganova2012LocalForecast/doc/Tsyganova2012LocalForecast.pdf}
}
Цыганова С.В., Стрижов В.В. Построение иерархических тематических моделей коллекции документов, 2012. Article
Abstract: Данная работа посвящена выявлению тематик коллекции текстов и их иерархической структуры. Поставлена задача построения иерархической тематической модели коллекции документов. Для решения поставленной задачи предлагается использование вероятностных тематических моделей. Особое внимание уделяется иерархическим тематическим моделям и, в частности, обсуждению свойств алгоритмов PLSA и LDA. Особенность построения иерархической модели заключается в переходе от понятия «мешка слов» к «мешку документов» в реализации плоских алгоритмов кластеризации. Работа алгоритмов иллюстрируется на текстах тезисов конференции EURO-2012 и на синтетических данных.
BibTeX:
@article{Tsyganova2012TopicIerarhy,
  author = {Цыганова, Светлана Валерьевна and Стрижов, Вадим Викторович},
  title = {Построение иерархических тематических моделей коллекции документов},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Tsyganova2012TopicIerarhy/tsyganova_strijov.pdf}
}
Варфоломеева А.А. Локальные методы прогнозирования с выбором метрики, 2012. Article
Abstract: В данной работе рассматривается локальный метод прогнозирования временных рядов. Исследуется вопрос выбора функции расстояния для нахождения похожих участков ряда. Проводится сравнение эффективности алгоритма построения прогноза при использовании различных метрик на модельных данных и временных рядах потребления электроэнергии и цен на сахар.
BibTeX:
@article{Varfolomeeva2012LocForecastMetrics,
  author = {Варфоломеева, Анна Андреевна},
  title = {Локальные методы прогнозирования с выбором метрики},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Varfolomeeva2012LocForecastMetrics/doc/Varfolomeeva2012LocForecastMetrics.pdf}
}
Варфоломеева А.А., Стрижов В.В. Выбор признаков при разметке библиографических списков методами структурного обучения, 2012. Article
Abstract: В предлагаемой работе исследуется задача отбора признаков при разметке библиографических списков методами структурной регрессии. Оптимизируются параметры алгоритма последовательного удаления и добавления признаков модели. Качество модели, основанной на методах структурного обучения, исследуется на наборе неформатированных библиографических списков. Иллюстрируется работа алгоритма для сегментации структурированных текстов: для каждого сегмента библиографической записи определяется ее тип поля. Также для каждой записи определяется ее тип в формате BibTeX.
BibTeX:
@article{Varfolomeeva2012StructureLearning,
  author = {Варфоломеева, Анна Андреевна and Стрижов, Вадим Викторович},
  title = {Выбор признаков при разметке библиографических списков методами структурного обучения},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group974/Varfolomeeva2012StructureLearning/doc/varfolomeeva_strijov.pdf}
}
Животовский Н.К. Комбинированный порождающий и разделяющий подход в задачах классификации с малой выборкой, 2012. Article
Abstract: Исследуется комбинированный порождающий и разделяющий подход в задачах классификации, описанный в tebishop. В серии экспериментов на модельных данных показано, что при некоторых ограничениях на длину обучающей выборки использование комбинированного подхода может приводить к уменьшению вероятности ошибки обученного модели.
BibTeX:
@article{Zhivotovskiy2012GenVsDisc,
  author = {Животовский, Никита Кириллович},
  title = {Комбинированный порождающий и разделяющий подход в задачах классификации с малой выборкой},
  year = {2012},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group774/Zhivotovskiy2012GenVsDisc/doc/GenVsDisc.pdf}
}

2011

Балдин Н.П. Исследование сходимости при прогнозировании нейронными сетями с обратной связью, 2011. Article
Abstract: Исследуется зависимость скорости сходимости при прогнозировании временных рядов от параметров нейронной сети с обратной связью.
В качестве модели нейронной сети используется сеть Джордана.
Предлагается проанализировать скорость сходимости в зависимости от выбора функции активации (сигмоидной, гиперболического тангенса), от числа нейронов в промежуточном слое и от ширины скользящего окна.
Также разбирается способ повышения скорости сходимости при использовании обобщенного дельта-правила.
BibTeX:
@article{Baldin2011FNNForecasting,
  author = {Балдин, Николай Петрович},
  title = {Исследование сходимости при прогнозировании нейронными сетями с обратной связью},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Baldin2011FNNForecasting/doc/baldin11FNNForecasting.pdf}
}
Будников Е.А. Прогнозирование функциями дискретного аргумента, 2011. Article
Abstract: В работе исследуются короткие временные ряды на примере монофонических музыкальных мелодий. Происходит прогнозирование одной ноты экспоненциальным сглаживанием, локальным методом, а также методом поиска постоянных закономерностей.

Вычислительный эксперимент проводится на двух мелодиях, одна из которых имеет точно повторяющиеся фрагменты.

BibTeX:
@article{Budnikov2011DiscreteForecasting,
  author = {Будников, Егор Алексеевич},
  title = {Прогнозирование функциями дискретного аргумента},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Budnikov2011DiscreteForecasting/docs/Budnikov2011Discrete.pdf}
}
Будников Е.А. Обзор некоторых статистических моделей естественных языков, 2011. Article
Abstract: В работе производится обзор и сравнение следующих моделей натурального языка: n-граммы, n-граммы на классах, дисконтная модель.
В первой части работы будет произведён обзор основной литературы по данной тематике, во второй части будут введены основные понятия и описаны сами методы.
BibTeX:
@article{Budnikov2011Statistical,
  author = {Будников, Егор Алексеевич},
  title = {Обзор некоторых статистических моделей естественных языков},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Budnikov2011Statistical/docs/Budnikov11Statistical.pdf}
}
Леонтьева Л.Н. Выбор моделей прогнозирования цен на электроэнергию, 2011. Article
Abstract: Исследуется проблема оптимальной сложности модели в связи с ее точностью и устойчивостью. Задача состоит в нахождении наиболее информативного набора признаков в условиях их высокой мультиколлинеарности. Для выбора оптимальной модели используется модифицированный алгоритм шаговой регрессии, являющийся одним из алгоритмов добавления и удаления признаков. В работе предложен метод поиска оптимальной модели прогнозирования цен на электроэнергию. В вычислительном эксперименте приведены результаты работы алгоритмов на временных рядах почасовых цен на электроэнергию.
BibTeX:
@article{Leonteva2011ElectricityConsumption,
  author = {Леонтьева, Любовь Николаевна},
  title = {Выбор моделей прогнозирования цен на электроэнергию},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Leonteva2011ElectricityConsumption/doc/Leonteva2011ElectricityConsumption.pdf}
}
Леонтьева Л.Н. Многомерная гусеница, выбор длины и числа компонент, 2011. Article
Abstract: В работе описывается метод гусеницы (SSA) и его применение для прогнозирования временных рядов. Алгоритм основан на выделении из изучаемого временного ряда некоторого набора его главных компонент и последующего построения прогноза по выбранному набору. Исследуется зависимость точности прогноза от выбора длины гусеницы и числа ее компонент. В вычислительном эксперименте приводятся результаты работы алгоритма на периодических рядах с разным рисунком внутри периода, на рядах с нарушением периодичности, а так же на реальных рядах почасовой температуры в Москве.
BibTeX:
@article{Leonteva2011GaterpillarLearning,
  author = {Леонтьева, Любовь Николаевна},
  title = {Многомерная гусеница, выбор длины и числа компонент},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Leonteva2011GaterpillarLearning/doc/Leonteva11SSA.pdf}
}
Литвинов И.А. Использование метода Белсли для прореживания признаков, 2011. Article
BibTeX:
@article{Litvinov2011Belsley,
  author = {Литвинов, Игорь Александрович},
  title = {Использование метода Белсли для прореживания признаков},
  year = {2011},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%98%D1%81%D0%BF%D0%BE%D0%BB%D1%8C%D0%B7%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BC%D0%B5%D1%82%D0%BE%D0%B4%D0%B0_%D0%91%D0%B5%D0%BB%D1%81%D0%BB%D0%B8_%D0%B4%D0%BB%D1%8F_%D0%BF%D1%80%D0%BE%D1%80%D0%B5%D0%B6%D0%B8%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F_%D0%BF%D1%80%D0%B8%D0%B7%D0%BD%D0%B0%D0%BA%D0%BE%D0%B2}
}
Мотренко А.П. Использование теста Гренджера при прогнозировании временных рядов, 2011. Article
Abstract: Работа посвящена исследованию возможностей применения теста Гренджера в прогнозировании временных рядов. В основе теста Гренджера лежат статистические тесты и использование линейных регрессионных моделей. Исследуется зависимость качества прогноза от порядка модели, способа обработки данных. В вычислительном эксперименте приводятся результаты работы алгоритма на различных временных рядах: стационарных, нестационарных, с обратной связью, независимых по Гренджеру.
BibTeX:
@article{Motrenko2011GrangerForc,
  author = {Мотренко, Анастасия Петровна},
  title = {Использование теста Гренджера при прогнозировании временных рядов},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Motrenko2011GrangerForc/doc/motrenko14granger.pdf}
}
Мотренко А.П. Многоклассовый прогноз вероятности наступления инфаркта и оценка необходимого объема выборки пациентов, 2011. Article
Abstract: В работе описан алгоритм, позволяющий классифицировать четыре группы пациентов: перенесшие инфаркт; больные, имеющие предрасположенность к инфаркту и здоровые пациенты двух типов. Признаками для для определения состояния пациента служат измерения концентрации белков в крови. Одной из задач работы является выбор набора маркеров, оптимального для разделения между собой соотвествующий групп. Классификация осуществляется по принципу ''каждый против каждого'', то есть решаются задачи классификации всевозможных пар групп. В силу высокой стоимости анализа крови, объемы данных невелики, поэтому одним из результов исследования является оценка необходимого объема выборки пациентов.
BibTeX:
@article{Motrenko2011HAPrediction,
  author = {Мотренко, Анастасия Петровна},
  title = {Многоклассовый прогноз вероятности наступления инфаркта и оценка необходимого объема выборки пациентов},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Motrenko2011HAPrediction/doc/Motrenko2011HAPrediction.pdf}
}
Панов М.Е. Аппроксимация функции ошибки, 2011. Article
Abstract: В работе рассматривается метод аппроксимации функции ошибки функцией многомерного нормального распределения. Рассматриваются случаи матрицы ковариации общего вида, диагональной матрицы ковариации, а также диагональной матрицы ковариации с равными значениями дисперсии. Для нормировки получившихся функций распределения используется аппроксимация Лапласа.
BibTeX:
@article{Panov2011ApproximateInference,
  author = {Панов, Максим Евгеньевич},
  title = {Аппроксимация функции ошибки},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group674/Panov2011ApproximateInference/doc/Panov2011ApproximateInference.pdf}
}
Павлов К.В. Оценка параметров смеси моделей, 2011. Article
Abstract: В работе рассматриваются способы построения смеси моделей и экспертов. Предлагается EM-алгоритм для совместного нахождения параметров моделей и их весов в смеси, а так же для нахождения параметров смеси обобщенных линейных моделей.
BibTeX:
@article{Pavlov2011ModelMixtures,
  author = {Павлов, Кирилл Владимирович},
  title = {Оценка параметров смеси моделей},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group674/Pavlov2011ModelMixtures/doc/pavlov2011modelmixtures.pdf}
}
Романенко А.А. Выравнивание временных рядов: прогнозирование с использованием DTW, 2011. Article
Abstract: Временной ряд - это повсеместно встечающаяся форма представления данных во многих научных дисциплинах. Задача, сопутствующая появлению временных рядов, - сравнение одной последовательности данных с другой. Dynamic time warping (DTW) представляет собой технику эффективного выравнивая временных рядов. Методы DTW используются при распознавании речи, при анализе информации в робототехнике, в промышленности, в медицине и других сферах. Предлагается классический алгоритм DTW и упоминаются его возможные модификации. В работе описывается алгоритм поиска в последовательности подпоследовательности, "больше всего похожей" на данную последовательность. Приведены результаты работы алгоритма.
BibTeX:
@article{Romanenko2011DTWForecasting,
  author = {Романенко, Александр Александрович},
  title = {Выравнивание временных рядов: прогнозирование с использованием DTW},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Romanenko2011DTWForecasting/doc/romanenko11Dynamic.pdf}
}
Романенко А.А. Событийное моделирование и прогноз финансовых временных рядов, 2011. Article
Abstract: Финансовые временные ряды обычно сильно зашумлены и зависят от других временных рядов (курс доллара, пошлины на таможне, и т.д.). Но насколько сильна эта зависимость, какие факторы учитывать при их прогнозировании, однозначно определить непросто. В работе для прогнозирования поведения целевого ряда используется разметка временных рядов. Предлагается алгоритм порождения признаков из размеченных временных рядов и генетический алгоритм отбора признаков на размеченных временных рядах.
BibTeX:
@article{Romanenko2011Event,
  author = {Романенко, Александр Александрович},
  title = {Событийное моделирование и прогноз финансовых временных рядов},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Romanenko2011Event/doc/Romanenko2011Event.pdf}
}
Рудой Г.И. Выбор функции активации при прогнозировании нейронными сетями, 2011. Article
Abstract: Целью работы является исследование зависимости качества прогнозирования временных рядов нейронными сетями от параметров нейронной сети. В частности, анализируется зависимость от выбранной функции активации нейронов в сети, а также от параметров этой функции. Функция активации описывает выходное значение нейрона в зависимости от взвешенной суммы его входов и порогового значения срабатывания. Рассматриваются сети с прямым распространением сигналов (без обратной связи). Приводятся результаты вычислительного эксперимента по прогнозированию нейронными сетями различных временных рядов и анализируется качество прогнозов при различных функциях активации и прочих параметрах сети.
BibTeX:
@article{Rudoy2011NNForecasting,
  author = {Рудой, Георгий Игоревич},
  title = {Выбор функции активации при прогнозировании нейронными сетями},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Rudoy2011NNForecasting/doc/rudoy10choosing.pdf}
}
Токмакова А.А. Оценивание гиперпараметров линейных регрессионных моделей при отборе шумовых и коррелирующих признаков, 2011. Article
Abstract: В работе решается задача отбора признаков при восстановлении линейной регрессии. Принята гипотеза о нормальном распределении вектора зависимой переменной и параметров модели. Для оценки ковариационной матрицы параметров используется аппроксимация Лапласа: логарифм функции ошибки приближается функцией нормального распределения. Исследуется проблема присутствия в выборке шумовых и коррелирующих признаков, так как при их наличии матрица ковариаций параметров модели становится вырожденной. Предлагается алгоритм, производящий отбор информативных признаков. В вычислительном эксперименте приводятся результаты исследования на временном ряде.
BibTeX:
@article{Tokmakova2011HyperPar,
  author = {Токмакова, Александра Алексеевна},
  title = {Оценивание гиперпараметров линейных регрессионных моделей при отборе шумовых и коррелирующих признаков},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Tokmakova2011HyperPar/doc/Tokmakova2011HyperPar.pdf}
}
Токмакова А.А. Выделение периодической компоненты из временного ряда, 2011. Article
Abstract: В проекте исследуется временной ряд на наличие периодической компоненты. На основе теории о рядах Фурье строится тригонометрическая интерполяция предложенных временных рядов методом наименьших квадратов. Также производится оценка параметров функции метода наименьших квадратов в зависимости от качества прогнозирования. В вычислительном эксперименте приводятся результаты работы корреляционной функции и метода наименьших квадратов на зашумлённом модельном синусе и реальном временном ряде электрокардиограммы.
BibTeX:
@article{Tokmakova2011Periodic,
  author = {Токмакова, Александра Алексеевна},
  title = {Выделение периодической компоненты из временного ряда},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group874/Tokmakova2011Periodic/doc/tokmakova11period.pdf}
}
Янович Ю.А. Статистический отчет при создании моделей, 2011. Article
Abstract: В данной работе приведен обзор статистических методов оценивания качества регрессионных моделей, используемых популярными программами машинного обучения и статистической обработки данных. Приведены примеры вычисления и анализа полученных оценок.
BibTeX:
@article{Yanovich2011StatModel,
  author = {Янович, Юрий Александрович},
  title = {Статистический отчет при создании моделей},
  year = {2011},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%BE%D1%82%D1%87%D0%B5%D1%82_%D0%BF%D1%80%D0%B8_%D1%81%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B8_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B5%D0%B9}
}
Зайцев А.А. Исследование устойчивости оценок ковариационной матрицы параметров, 2011. Article
Abstract: В данной работе исследуется устойчивость оценок ковариационной матрицы параметров модели.
Рассматриваются модели линейной регрессии.
Тогда вектор параметров модели соответствует набору признаков модели.
Ковариационная матрица параметров строится в предположении о вероятностном распределении вектора параметров.
Исследуется, зависит ли оценка ковариационной матрицы признаков от того, являются ли признаки мультикоррелирующими.
Для такой матрицы плана получаем расширенный вектор параметров модели и оценку матрицы ковариации параметров модели.
Сравнивается ковариационная матрица для нерасширенного и расширенного вектора параметров модели.
Исследуется пространство параметров для информативных признаков.
BibTeX:
@article{Zaitsev2011CovarianceEstimation,
  author = {Зайцев, Алексей Алексеевич},
  title = {Исследование устойчивости оценок ковариационной матрицы параметров},
  year = {2011},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group674/Zaitsev2011CovarianceEstimation/doc/}
}

2010

Дорофеев Д.В. Библиотеки C++ для анализа данных, 2010. Article
BibTeX:
@article{Dorofeev2010C_library,
  author = {Дорофеев, Данила Викторович},
  title = {Библиотеки C++ для анализа данных},
  year = {2010},
  note = {Presentation},
  url = {http://www.machinelearning.ru/wiki/images/8/88/C_library.pdf}
}
Джамтырова Р.Б. Шаговая регрессия, 2010. Article
Abstract: В данной статье рассматриваются два метода отбора признаков: метод наименьших углов и шаговая регрессия. Эти методы похожи. Различие заключается в том, что алгоритм LARS, вместо последовательного добавления и удаления свободных переменных, на каждом шаге изменяет их веса.
BibTeX:
@article{Dzhamtyrova2010FeatureSelection,
  author = {Джамтырова, Раиса Баировна},
  title = {Шаговая регрессия},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%A8%D0%B0%D0%B3%D0%BE%D0%B2%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Джамтырова Р.Б. Долгосрочное прогнозирование ежедневных цен на электроэнергию, 2010. Article
Abstract: Решается задача долгосрочного прогнозирования цен на электроэнергию. Долгосрочное прогнозирование цен является основой для планирования и инвестирования. Для решения задачи рассматривается метод авторегрессии. При построении модели также производится отбор признаков при помощи метода наименьших углов.
BibTeX:
@article{Dzhamtyrova2010Forecasting,
  author = {Джамтырова, Раиса Баировна},
  title = {Долгосрочное прогнозирование ежедневных цен на электроэнергию},
  year = {2010},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group774/Dzhamtyrova2010Forecasting/doc/Dzhamtyrova10forecasting.pdf}
}
Фадеев И.В. Прогнозирование временных рядов методом SSA, 2010. Article
Abstract: В работе описывается и производится сравнение эффективности ряда алгоритмов для краткосрочного прогнозирования цен на электроэнергию: SSA, авторегрессии, гребневой регрессии, метода наименьших углов, метода построения локальных регрессионных моделей. В вычислительном эксперименте приводятся результаты работы перечисленных алгоритмов, сравнивается точность из прогнозов.
BibTeX:
@article{Fadeev2010Forecasting,
  author = {Фадеев, Илья Владимирович},
  title = {Прогнозирование временных рядов методом SSA},
  year = {2010},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group774/Fadeev2010Forecasting/doc/fadeev10farecasting.pdf}
}
Фирстенко А.Н. Построение интегральных индикаторов по ранговым признакам, 2010. Article
Abstract: В данной работе описывается подход к построению интегрального индикатора для множества объектов, характеризуемых признаками, выраженными в ранговых шкалах. В качестве интегрального индикатора предлагается рассматривать бинарное отношение на множестве объектов, позволяющее сравнивать объекты между собой. Бинарное отношение строится на основании признакового описания объектов и информации о важности каждого признака, задаваемой экспертами. Подход продемонстрирован на работе алгоритма уточнения экспертной информации.
BibTeX:
@article{Firstenko2010RankIndicators,
  author = {Фирстенко, Александр Николаевич},
  title = {Построение интегральных индикаторов по ранговым признакам},
  year = {2010},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group774/Firstenko2010RankIndicators/doc/firstenko10building.pdf}
}
Фирстенко А.Н. Символьная регрессия и структурное расстояние между моделями, 2010. Article
Abstract: Символьная регрессия — метод построения регрессионных моделей путем перебора различных произвольных суперпозиций функций из некоторого заданного набора. Суперпозиция функций при этом называется «программой», а стохастический оптимизационный алгоритм построения таких суперпозиций называется генетическим программированием. Под структурным расстоянием в данном случае понимается количественная оценка степени структурного различия помеченных графов, соответствующих суперпозициям, которая зависит от размера их наибольшего общего подграфа. Чем больше общий подграф, тем больше структурное подобие моделей.
BibTeX:
@article{Firstenko2010Symbolic,
  author = {Фирстенко, Александр Николаевич},
  title = {Символьная регрессия и структурное расстояние между моделями},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%A1%D0%B8%D0%BC%D0%B2%D0%BE%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F_%D0%B8_%D1%81%D1%82%D1%80%D1%83%D0%BA%D1%82%D1%83%D1%80%D0%BD%D0%BE%D0%B5_%D1%80%D0%B0%D1%81%D1%81%D1%82%D0%BE%D1%8F%D0%BD%D0%B8%D0%B5_%D0%BC%D0%B5%D0%B6%D0%B4%D1%83_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D1%8F%D0%BC%D0%B8_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Ивкин Н.П. Анализ регрессионных остатков, 2010. Article
Abstract: Для получения информации об адекватности построенной модели многомерной линейной регрессии используется анализ регрессионных остатков.
BibTeX:
@article{Ivkin2010Analysis,
  author = {Ивкин, Никита Петрович},
  title = {Анализ регрессионных остатков},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%BE%D0%BD%D0%BD%D1%8B%D1%85_%D0%BE%D1%81%D1%82%D0%B0%D1%82%D0%BA%D0%BE%D0%B2_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Ивкин Н.П. Прогнозирование концентрации кислорода в выхлопных газах дизельного двигателя, 2010. Article
Abstract: Рассматривается узкий класс задач восстановления регрессионной зависимости от временных рядов, включающих более тысячи измерений. Предложен метод представления представления этих рядов малым количеством более информативных признаков. Решается задача прогнозирования концентрации кислорода в выхлопных газах дизельного двигателя с применением метода моделирования временных рядов. Представлен численный эксперимент.
BibTeX:
@article{Ivkin2010ForecastingO_2,
  author = {Ивкин, Никита Петрович},
  title = {Прогнозирование концентрации кислорода в выхлопных газах дизельного двигателя},
  year = {2010},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group774/Ivkin2010ForecastingO_2/doc/ivkin10forecastingO_2.pdf}
}
Кононенко Д.С. Прогнозирование финансовых пузырей, 2010. Article
Abstract: Рассматривается метод прогнозирования финансовых пузырей на основании информации, данной экспертом о наличии пузырей во временных рядах. Предлагается способ синтеза и отбора признаков, описывающих временной ряд. Алгоритм основан на разметке интервалов роста и падения временного ряда и применении логистической регрессии для настройки параметров линейной модели и оценки ее качества. Проведен вычислительный эксперимент на данных о ценах на сырье с 1995 по 2010 год.
BibTeX:
@article{Kononenko2010FinancialBubbles,
  author = {Кононенко, Даниил Сергеевич},
  title = {Прогнозирование финансовых пузырей},
  year = {2010},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group774/Kononenko2010FinancialBubbles/doc/Kononenko10Forecasting.pdf}
}
Кононенко Д.С. Однослойные сети RBF для решения задач регрессии, 2010. Article
Abstract: Цель работы - решить задачу регрессии с помощью сети радиальных базисных функций и исследовать некоторые свойства алгоритма.
BibTeX:
@article{Kononenko2010SingleLayerRBF,
  author = {Кононенко, Даниил Сергеевич},
  title = {Однослойные сети RBF для решения задач регрессии},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B4%D0%BD%D0%BE%D1%81%D0%BB%D0%BE%D0%B9%D0%BD%D1%8B%D0%B5_%D1%81%D0%B5%D1%82%D0%B8_RBF_%D0%B4%D0%BB%D1%8F_%D1%80%D0%B5%D1%88%D0%B5%D0%BD%D0%B8%D1%8F_%D0%B7%D0%B0%D0%B4%D0%B0%D1%87_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%B8_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Корниенко А.И. SVM регрессия, 2010. Article
BibTeX:
@article{Kornienko2010SVMRegression,
  author = {Корниенко, Алексей Иванович},
  title = {SVM регрессия},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=SVM_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Козлов И.В. Кластеризация графов без использования метрик, 2010. Article
Abstract: Данная работа посвящена решению задачи кластеризации. Рассматривается задача кластеризации на графах, на которых не задана метрика. Подобная задача может встретиться, например, при анализе групп знакомств в социальных сетях. Для ее решения предлагается использовать вероятностный алгоритм построения дендрограммы.
BibTeX:
@article{Kozlov2010Karger,
  author = {Козлов, Илья Владимирович},
  title = {Кластеризация графов без использования метрик},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9A%D0%BB%D0%B0%D1%81%D1%82%D0%B5%D1%80%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F_%D0%B3%D1%80%D0%B0%D1%84%D0%BE%D0%B2_%D0%B1%D0%B5%D0%B7_%D0%B8%D1%81%D0%BF%D0%BE%D0%BB%D1%8C%D0%B7%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F_%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%BA_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Кузнецов М.П. Оценка эффективности природоохранных программ, 2010. Article
Abstract: Описан способ построения интегральных индикаторов качества объектов с использованием экспертных оценок и измеряемых данных. Каждый объект описан набором признаков в линейных шкалах. Используются экспертные оценки качества объектов и важности признаков, которые корректируются в процессе вычисления. Предполагается, что оценки выставлены в ранговых шкалах. Рассматривается задача получения таких интегральных индикаторов, которые не противоречили бы экспертным оценкам. Предложено два алгоритма уточнения экспертных оценок.
BibTeX:
@article{Kuznetsov2010Nature,
  author = {Кузнецов, Михаил Павлович},
  title = {Оценка эффективности природоохранных программ},
  year = {2010},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group774/Kuznetsov2010Nature/doc/Kuznetsov10Estimation.pdf}
}
Кузнецов М.П. Прореживание двухслойной нейронной сети, 2010. Article
Abstract: Прореживание двухслойной нейронной сети (optimal brain damage) — метод упрощения структуры нейронной сети. Идея прореживания состоит в том, что из сети удаляются параметры, оказывающие малое влияние на ошибку аппроксимации. Таким образом, модель упрощается, а ошибка аппроксимации возрастает незначительно.
BibTeX:
@article{Kuznetsov2010Thinning,
  author = {Кузнецов, Михаил Павлович},
  title = {Прореживание двухслойной нейронной сети},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9F%D1%80%D0%BE%D1%80%D0%B5%D0%B6%D0%B8%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%B4%D0%B2%D1%83%D1%85%D1%81%D0%BB%D0%BE%D0%B9%D0%BD%D0%BE%D0%B9_%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D0%BD%D0%BD%D0%BE%D0%B9_%D1%81%D0%B5%D1%82%D0%B8_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Литвинов И.А. MathCAD: визуализация данных и иллюстрация результатов анализа данных, 2010. Article
BibTeX:
@article{Litvinov2010MathCAD,
  author = {Литвинов, Игорь Александрович},
  title = {MathCAD: визуализация данных и иллюстрация результатов анализа данных},
  year = {2010},
  note = {Presentation},
  url = {http://www.machinelearning.ru/wiki/images/3/3b/MathCad.pdf}
}
Мафусалов А.А. Порождение нелинейных регрессионных моделей, 2010. Article
BibTeX:
@article{Mafusalov2010Producing,
  author = {Мафусалов, Александр Александрович},
  title = {Порождение нелинейных регрессионных моделей},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9F%D0%BE%D1%80%D0%BE%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BD%D0%B5%D0%BB%D0%B8%D0%BD%D0%B5%D0%B9%D0%BD%D1%8B%D1%85_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%BE%D0%BD%D0%BD%D1%8B%D1%85_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B5%D0%B9_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Мафусалов А.А. Поиск нелинейной модели поверхности Мохоровичича, 2010. Article
Abstract: Рассматривается задача восстановления функциональной зависимости глубины прохождения поверхности раздела пород земной коры от значений поля силы тяжести на определенных высотах. На вид зависимости накладываются ограничения в силу особенностей задачи. Применяется символьная регрессия и метод полного перебора суперпозиций, полученных из заданного набора функций. Построен алгоритм нахождения парето-оптимального фронта по совокупности критериев качества.
BibTeX:
@article{Mafusalov2010Search,
  author = {Мафусалов, Александр Александрович},
  title = {Поиск нелинейной модели поверхности Мохоровичича},
  year = {2010},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group774/Mafusalov2010Search/doc/Mafusalov10Search.pdf}
}
Минаев П.Ю. Описание окрестности точки наибольшего правдоподобия моделей, 2010. Article
BibTeX:
@article{Minaev2010Maximum,
  author = {Минаев, Павел Юрьевич},
  title = {Описание окрестности точки наибольшего правдоподобия моделей},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%BF%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BE%D0%BA%D1%80%D0%B5%D1%81%D1%82%D0%BD%D0%BE%D1%81%D1%82%D0%B8_%D1%82%D0%BE%D1%87%D0%BA%D0%B8_%D0%BD%D0%B0%D0%B8%D0%B1%D0%BE%D0%BB%D1%8C%D1%88%D0%B5%D0%B3%D0%BE_%D0%BF%D1%80%D0%B0%D0%B2%D0%B4%D0%BE%D0%BF%D0%BE%D0%B4%D0%BE%D0%B1%D0%B8%D1%8F_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B5%D0%B9_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Морозов А.А. Прогнозирование класса третичной структуры белка по первичной, 2010. Article
Abstract: Рассматривается задача классификации третичной структуры белка по его аминокислотной последовательности. Эта задача является актуальной проблемой биоинформатики последние 20 лет. В работе предлагается использовать для создания признакового описания частоты встречаемости аминокислот в последовательности первичной структуры белка. Для решения задачи применяется алгоритм "Метод ближайшего соседа". Построен график точности алгоритма с доверительными интервалами в зависимости от параметров предложенного алгоритма.
BibTeX:
@article{Morozov2010ProteinForecasting,
  author = {Морозов, Алексей Александрович},
  title = {Прогнозирование класса третичной структуры белка по первичной},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9F%D1%80%D0%BE%D0%B3%D0%BD%D0%BE%D0%B7%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B0_%D1%82%D1%80%D0%B5%D1%82%D0%B8%D1%87%D0%BD%D0%BE%D0%B9_%D1%81%D1%82%D1%80%D1%83%D0%BA%D1%82%D1%83%D1%80%D1%8B_%D0%B1%D0%B5%D0%BB%D0%BA%D0%B0_%D0%BF%D0%BE_%D0%BF%D0%B5%D1%80%D0%B2%D0%B8%D1%87%D0%BD%D0%BE%D0%B9_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Морозов А.А. SVM для линейно разделимой выборки, 2010. Article
Abstract: В данной статье приведен пример решения этой задачи для линейно разделимой выборки. Также исследуется устойчивость алгоритма: зависимость параметров разделяющей гиперплоскости от дисперсии случайной переменной.
BibTeX:
@article{Morozov2010SVMLinear,
  author = {Морозов, Алексей Александрович},
  title = {SVM для линейно разделимой выборки},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=SVM_%D0%B4%D0%BB%D1%8F_%D0%BB%D0%B8%D0%BD%D0%B5%D0%B9%D0%BD%D0%BE_%D1%80%D0%B0%D0%B7%D0%B4%D0%B5%D0%BB%D0%B8%D0%BC%D0%BE%D0%B9_%D0%B2%D1%8B%D0%B1%D0%BE%D1%80%D0%BA%D0%B8_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Островский А.В. Использование Simulink для анализа данных, 2010. Article
Панов М.Е. Python и его применение в анализе данных, 2010. Article
BibTeX:
@article{Panov2010Python,
  author = {Панов, Максим Евгеньевич},
  title = {Python и его применение в анализе данных},
  year = {2010},
  note = {Presentation},
  url = {http://www.machinelearning.ru/wiki/images/1/1a/Python.pdf}
}
Павлов К.В. MySQL за 42 минуты, 2010. Article
BibTeX:
@article{Pavlov2010MySQL,
  author = {Павлов, Кирилл Владимирович},
  title = {MySQL за 42 минуты},
  year = {2010},
  note = {Presentation},
  url = {http://www.machinelearning.ru/wiki/images/e/e2/MySQL.pdf}
}
Романенко А.А. Сравнение временных рядов при авторегрессионном прогнозе, 2010. Article
Abstract: Данная работа посвящена исследованию зависимости между пространственными характеристиками (форма, период) временного ряда и распределением параметров регрессионных моделей, которые описывают эти временные ряды. Один из подходов исследовать данную зависимость - посмотреть, как распределены параметры моделей для похожих в некотором смысле временных рядов, и насколько эти распределения различаются для непохожих (различных в некотором смысле) временных рядов.
BibTeX:
@article{Romanenko2010Compare,
  author = {Романенко, Алексей Александрович},
  title = {Сравнение временных рядов при авторегрессионном прогнозе},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%A1%D1%80%D0%B0%D0%B2%D0%BD%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B2%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D1%8B%D1%85_%D1%80%D1%8F%D0%B4%D0%BE%D0%B2_%D0%BF%D1%80%D0%B8_%D0%B0%D0%B2%D1%82%D0%BE%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%BE%D0%BD%D0%BD%D0%BE%D0%BC_%D0%BF%D1%80%D0%BE%D0%B3%D0%BD%D0%BE%D0%B7%D0%B5_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Савинов Н.А. Выбор признаков с помощью генетических алгоритмов, 2010. Article
Abstract: Генетический алгоритм — эвристический алгоритм поиска, используется для решения задач оптимизации. Название обусловлено смыслом эвристики: моделируется биологический естественный отбор, степень приспособленности определяется значением целевой функции. Возможно применение генетического алгоритма для выбора признаков линейной регрессии, поскольку данная задача допускает оптимизационную формулировку (если множество порождающих функций зафиксировано).
BibTeX:
@article{Savinov2010Genetic,
  author = {Савинов, Николай Анатольевич},
  title = {Выбор признаков с помощью генетических алгоритмов},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%92%D1%8B%D0%B1%D0%BE%D1%80_%D0%BF%D1%80%D0%B8%D0%B7%D0%BD%D0%B0%D0%BA%D0%BE%D0%B2_%D1%81_%D0%BF%D0%BE%D0%BC%D0%BE%D1%89%D1%8C%D1%8E_%D0%B3%D0%B5%D0%BD%D0%B5%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D1%85_%D0%B0%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC%D0%BE%D0%B2_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Сечин П.А. Прогнозирование макроэкономических показателей с помощью векторной авторегрессии, 2010. Article
Abstract: Одной из актуальных задач экономики является прогнозирование макросостояния экономики по наблюдаемым данным. Формальная постановка представляет собой прогнозирование временных рядов с малым временным горизонтом. Метод векторной авторергрессии неструктурного прогнозирования состоит в поиске линейной зависимости значения временного ряда в данный момент времени от фиксированного числа предыдущих моментов времени. Рассматривается метод нахождения коэффициентов векторной авторегрессии. В качестве примера данных рассматриваются значения параметров экономики России. В результате вычислительного эксперимента получена модель экономики России с пятипроцентной ошибкой прогноза.
BibTeX:
@article{Sechin2010Forecasting,
  author = {Сечин, Павел Андреевич},
  title = {Прогнозирование макроэкономических показателей с помощью векторной авторегрессии},
  year = {2010},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group774/Sechin2010Forecasting/doc/sechin_econom.pdf}
}
Сечин П.А. SVM для линейно неразделимой выборки, 2010. Article
Abstract: В данной статье приведен пример решения этой задачи для линейно неразделимой выборки с использованием функции ядра (в англоязычной литературе приём носит название kernel trick).
BibTeX:
@article{Sechin2010SVMNonlinear,
  author = {Сечин, Павел Андреевич},
  title = {SVM для линейно неразделимой выборки},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=SVM_%D0%B4%D0%BB%D1%8F_%D0%BB%D0%B8%D0%BD%D0%B5%D0%B9%D0%BD%D0%BE_%D0%BD%D0%B5%D1%80%D0%B0%D0%B7%D0%B4%D0%B5%D0%BB%D0%B8%D0%BC%D0%BE%D0%B9_%D0%B2%D1%8B%D0%B1%D0%BE%D1%80%D0%BA%D0%B8_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Синцова В.В. Исследование скорости сходимости параметров и гиперпараметров, 2010. Article
Abstract: Для фиксированной регрессионной модели исследуется скорость сходимости параметров и гиперпараметров при ее настройке через двухуровневый байесовский вывод.
BibTeX:
@article{Sintsova2010Bayesian,
  author = {Синцова, Валентина Вадимовна},
  title = {Исследование скорости сходимости параметров и гиперпараметров},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%98%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D1%81%D0%BA%D0%BE%D1%80%D0%BE%D1%81%D1%82%D0%B8_%D1%81%D1%85%D0%BE%D0%B4%D0%B8%D0%BC%D0%BE%D1%81%D1%82%D0%B8_%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%BE%D0%B2_%D0%B8_%D0%B3%D0%B8%D0%BF%D0%B5%D1%80%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%BE%D0%B2_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Скипор К.С. Знакомство с Maple, 2010. Article
BibTeX:
@article{Skipor2010Maple,
  author = {Скипор, Константин Станиславович},
  title = {Знакомство с Maple},
  year = {2010},
  note = {Presentation},
  url = {http://www.machinelearning.ru/wiki/images/2/2d/MapleOverview.pdf}
}
Спирин Н.В. Multilevel Modeling with R, 2010. Article
BibTeX:
@article{Spirin2010Multilevel,
  author = {Спирин, Никита Валерьевич},
  title = {Multilevel Modeling with R},
  year = {2010},
  note = {Presentation},
  url = {http://www.machinelearning.ru/wiki/images/7/7a/Multilevel_Modeling_with_R.pdf}
}
Сунгуров Д.С. Классификация пациентов CVD с помощью биомаркеров, 2010. Article
Abstract: В работе осуществляется классификация поциентов по группам риска. Проводится отбор признаков и строится классификатор на четыре класса. Для классификации используется SVM.
BibTeX:
@article{Sungurov2010CVD,
  author = {Сунгуров, Дмитрий Сергеевич},
  title = {Классификация пациентов CVD с помощью биомаркеров},
  year = {2010},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group774/Sungurov2010CVD/Sungurov2010CVD.pdf}
}
Сунгуров Д.С. Анализ мультиколлинеарности, 2010. Article
Abstract: Мультиколлинеарность — тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат, которая затрудняет оценивание регрессионных параметров.
BibTeX:
@article{Sungurov2010Multicollinearity,
  author = {Сунгуров, Дмитрий Сергеевич},
  title = {Анализ мультиколлинеарности},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%BC%D1%83%D0%BB%D1%8C%D1%82%D0%B8%D0%BA%D0%BE%D0%BB%D0%BB%D0%B8%D0%BD%D0%B5%D0%B0%D1%80%D0%BD%D0%BE%D1%81%D1%82%D0%B8_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Урлов Е.Н. Вычисление гиперпараметров при различных гипотезах порождения данных, 2010. Article
BibTeX:
@article{Urlov2010EstimationHyperparam,
  author = {Урлов, Евгений Николаевич},
  title = {Вычисление гиперпараметров при различных гипотезах порождения данных},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%92%D1%8B%D1%87%D0%B8%D1%81%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B3%D0%B8%D0%BF%D0%B5%D1%80%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%BE%D0%B2_%D0%BF%D1%80%D0%B8_%D1%80%D0%B0%D0%B7%D0%BB%D0%B8%D1%87%D0%BD%D1%8B%D1%85_%D0%B3%D0%B8%D0%BF%D0%BE%D1%82%D0%B5%D0%B7%D0%B0%D1%85_%D0%BF%D0%BE%D1%80%D0%BE%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D1%8F_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Янович Ю.А. Знакомство с Mathematica, 2010. Article
BibTeX:
@article{Yanovich2010MathematicaIntro,
  author = {Янович, Юрий Александрович},
  title = {Знакомство с Mathematica},
  year = {2010},
  note = {Presentation},
  url = {http://www.machinelearning.ru/wiki/images/3/37/MathematicaIntro.pdf}
}
Юдаев М.Д. GAP: использование алгебраических структур при постановке задач, 2010. Article
BibTeX:
@article{Yudaev2010GAP,
  author = {Юдаев, Михаил Дмитриевич},
  title = {GAP: использование алгебраических структур при постановке задач},
  year = {2010},
  note = {Presentation},
  url = {http://www.machinelearning.ru/wiki/images/d/d3/%D0%A7%D1%82%D0%BE_%D0%B5%D1%81%D1%82%D1%8C_GAP.pdf}
}
Зайцев Е.Ю. Аппроксимация Лапласа, 2010. Article
Abstract: Аппроксимация Лапласа - способ оценки параметров нормального распределения при аппроксимации заданной плотности вероятности.
BibTeX:
@article{Zaitsev2010Laplace,
  author = {Зайцев, Евгений Юрьевич},
  title = {Аппроксимация Лапласа},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%90%D0%BF%D0%BF%D1%80%D0%BE%D0%BA%D1%81%D0%B8%D0%BC%D0%B0%D1%86%D0%B8%D1%8F_%D0%9B%D0%B0%D0%BF%D0%BB%D0%B0%D1%81%D0%B0_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Зайцев А.А. Введение в SAS, 2010. Article
BibTeX:
@article{Zaitsev2010SASintro,
  author = {Зайцев, Алексей Алексеевич},
  title = {Введение в SAS},
  year = {2010},
  note = {Presentation},
  url = {http://www.machinelearning.ru/wiki/images/f/f5/Zaitsev10SASintro.pdf}
}
Животовский Н.К. Группировка категорий и сегментация признаков в логистической регрессии, 2010. Article
Abstract: Группировка категорий — метод снижения числа признаков, полученных с помощью бинаризации номинальных шкал в модели логистической регрессии.
Сегментация признака - разбиение множества значений признака на некоторые семейства таким образом, чтобы учесть нелинейные зависимости значений признака в обобщенно - линейной модели.
BibTeX:
@article{Zhivotovskiy2010Category,
  author = {Животовский, Никита Кириллович},
  title = {Группировка категорий и сегментация признаков в логистической регрессии},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%93%D1%80%D1%83%D0%BF%D0%BF%D0%B8%D1%80%D0%BE%D0%B2%D0%BA%D0%B0_%D0%BA%D0%B0%D1%82%D0%B5%D0%B3%D0%BE%D1%80%D0%B8%D0%B9_%D0%B8_%D1%81%D0%B5%D0%B3%D0%BC%D0%B5%D0%BD%D1%82%D0%B0%D1%86%D0%B8%D1%8F_%D0%BF%D1%80%D0%B8%D0%B7%D0%BD%D0%B0%D0%BA%D0%BE%D0%B2_%D0%B2_%D0%BB%D0%BE%D0%B3%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B9_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%B8_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Животовский Н.К. Порождение суперпозиций при выборе модели кредитного скоринга, 2010. Article
Abstract: В работе осуществляется построение регрессионной модели для задачи кредитного скоринга. Кроме отбора, сегментации линейных признаков и группировки категориальных признаков осуществляется еще и порождение новых признаков с помощью заданных порождающих функций.
BibTeX:
@article{Zhivotovskiy2010Superpositions,
  author = {Животовский, Никита Кириллович},
  title = {Порождение суперпозиций при выборе модели кредитного скоринга},
  year = {2010},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group774/Zhivotovskiy2010Superpositions/zhivotovskiy11superpositions.pdf}
}
Зухба А.В. Оценка сложности регрессионных моделей, 2010. Article
BibTeX:
@article{Zuhba2010ModelComplexity,
  author = {Зухба, Анастасия Викторовна},
  title = {Оценка сложности регрессионных моделей},
  year = {2010},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D1%86%D0%B5%D0%BD%D0%BA%D0%B0_%D1%81%D0%BB%D0%BE%D0%B6%D0%BD%D0%BE%D1%81%D1%82%D0%B8_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%BE%D0%BD%D0%BD%D1%8B%D1%85_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B5%D0%B9_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}

2009

Дорофеев Д.В. Выбор оптимального алфавита марковских моделей для распознавания речи, 2009. Article
Abstract: В данной работе для статистического моделирования спектральной динамики гласных и согласных звуков применяется скрытая марковская модель (СММ) из 3-х последовательных состояний. Классификация аллофонов осуществляется с помощью бинарных деревьев. Построение дерева осуществляется алгоритмом ID3.
BibTeX:
@article{Dorofeev2009Allophone,
  author = {Дорофеев, Данила Викторович},
  title = {Выбор оптимального алфавита марковских моделей для распознавания речи},
  year = {2009},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group674/Dorofeev2009Allophone/Systemdocs.doc}
}
Дорофеев Д.В. Логистическая регрессия для решения задач классификации, 2009. Article
Abstract: Для заданной выборки требуется восстановить логистическую регрессию. Построить графики для различных модельных выборок. На каждом графике показать разделяющую гиперплоскость, показать исходные и восстановленные метки класса для каждого объекта.
BibTeX:
@article{Dorofeev2009Logistic,
  author = {Дорофеев, Данила Викторович},
  title = {Логистическая регрессия для решения задач классификации},
  year = {2009},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9B%D0%BE%D0%B3%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F_%D0%B4%D0%BB%D1%8F_%D1%80%D0%B5%D1%88%D0%B5%D0%BD%D0%B8%D1%8F_%D0%B7%D0%B0%D0%B4%D0%B0%D1%87_%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D0%B8_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Гущин А.В., Ежова Е.О. Композиции нейронных сетей для задачи регрессии, 2009. Article
Abstract: В данной задаче рассматриваются нейронные сети, построенные как композиции однослойных нейронных сетей. На первом этапе строится набор однослойных нейронных сетей, настраиваются их параметры с помощью метода стохастического градиента, методом оптимального повреждения сети (Optimal Brain Damage) удаляются неинформативные связи . На втором этапе происходит создание новых нейронных сетей, в которых в качестве нейронов используются однослойные нейронные сети, полученные на первом этапе алгоритма. Снова происходит настройка моделей и удаление избыточных связей. Затем вычисляется ошибка построенных моделей на обучающей и на тестовой выборке, происходит сравнение моделей. Требуется найти наилучшую модель , вычисленные ошибки для которой минимальны.
BibTeX:
@article{GushchinEzhova2009NeuralNet,
  author = {Гущин, Андрей Викторович and Ежова, Елена Олеговна},
  title = {Композиции нейронных сетей для задачи регрессии},
  year = {2009},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/MIPT2006-2010OldProj/GushchinEzhova2009NeuralNet/report/report.doc}
}
Лебедева И.Е. Порождение и выбор авторегрессионных моделей, 2009. Article
Abstract: Целью исследования является прогноз среднесуточной цены на электроэнергию. Горизонт прогнозирования предполагается длиной в месяц. Целью исследования является прогноз среднесуточной цены на электроэнергию. Горизонт прогнозирования предполагается длиной в месяц.
BibTeX:
@article{Lebedeva2009Autoregression,
  author = {Лебедева, Ирина Евгеньевна},
  title = {Порождение и выбор авторегрессионных моделей},
  year = {2009},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/MIPT2006-2010OldProj/Lebedeva2009Autoregression/}
}
Литвинов И.А. Метод k ближайших соседей, 2009. Article
Abstract: Метод K ближайших соседей - это метрический алгоритм классификации, основанный на оценивании сходства объектов. Классифицируемый объект относится к тому классу, которому принадлежат ближайшие к нему объекты обучающей выборки.
BibTeX:
@article{Litvinov2009KMeans,
  author = {Литвинов, Игорь Александрович},
  title = {Метод k ближайших соседей},
  year = {2009},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_k_%D0%B1%D0%BB%D0%B8%D0%B6%D0%B0%D0%B9%D1%88%D0%B8%D1%85_%D1%81%D0%BE%D1%81%D0%B5%D0%B4%D0%B5%D0%B9_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Литвинов И.А. Прогнозирование объемов продаж новых товаров, 2009. Article
Abstract: Цель проекта - прогнозирование еженедельных продаж новых товаров.

Прогнозирование производится методом квантильной регрессии для различных квантилей.
Также используются эвристические алгоритмы прогнозирование продаж экспонентой, параболой и логарифмом.

BibTeX:
@article{Litvinov2009NewGoods,
  author = {Литвинов, Игорь Александрович},
  title = {Прогнозирование объемов продаж новых товаров},
  year = {2009},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group674/Litvinov2009NewGoods/Docs/Systemdocs.doc}
}
Островский А.В. Прогнозирование объемов продаж групп товаров, 2009. Article
Abstract: Цель проекта — прогнозирование еженедельных покупок товаров. Горизонт прогнозирования — одна неделя.
Предполагается, что товары могут быть агрегированы в группы, исходя из их цены и «близости» по товарному классификатору. Затем может быть осуществлен прогноз для получившихся групп товаров и «разбрасывание» результатов прогнозирования по отдельным товарам из групп.
BibTeX:
@article{Ostrovskiy2009Groups,
  author = {Островский, Алексей Викторович},
  title = {Прогнозирование объемов продаж групп товаров},
  year = {2009},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group674/Ostrovskiy2009Groups/Docs/Systemdocs_Groups.doc}
}
Островский А.В. Функции радиального базиса, 2009. Article
Abstract: Функция радиального базиса — функция, значение которой зависит только от нормы аргумента. RBF используются в метрических алгоритмах классификации, в частности в методе потенциальных функций, который (в упрощенном виде) рассматривается в этой статье.
BibTeX:
@article{Ostrovskiy2009RBF,
  author = {Островский, Алексей Викторович},
  title = {Функции радиального базиса},
  year = {2009},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%A4%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D0%B8_%D1%80%D0%B0%D0%B4%D0%B8%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D0%B3%D0%BE_%D0%B1%D0%B0%D0%B7%D0%B8%D1%81%D0%B0_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Панов М.Е. Классификация пациентов с сердечно-сосудистыми заболеваниями, 2009. Article
Abstract: Данная система решает задачу классификации объектов на 2 класса с одновременным отбором признаков.
BibTeX:
@article{Panov2009Cardio,
  author = {Панов, Максим Евгеньевич},
  title = {Классификация пациентов с сердечно-сосудистыми заболеваниями},
  year = {2009},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group674/Panov2009Cardio/Systemdocs1.docx}
}
Панов М.Е. Однослойный персептрон, 2009. Article
Abstract: Однослойный персептрон — это линейный алгоритм классификации, принцип работы которого основан на модели нервной клетки - нейрона. Представляет собой пример нейронной сети с одним скрытым слоем.
Для заданной выборки требуется восстановить классификацию с помощью нейронных сетей с одним скрытым слоем.
Построить графики для различных модельных выборок. На каждом графике показать исходные и восстановленные метки класса для каждого объекта.
BibTeX:
@article{Panov2009OneLayerPerceptron,
  author = {Панов, Максим Евгеньевич},
  title = {Однослойный персептрон},
  year = {2009},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B4%D0%BD%D0%BE%D1%81%D0%BB%D0%BE%D0%B9%D0%BD%D1%8B%D0%B9_%D0%BF%D0%B5%D1%80%D1%81%D0%B5%D0%BF%D1%82%D1%80%D0%BE%D0%BD_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Павлов К.В. EM-алгоритм с последовательным добавлением компонент, 2009. Article
Abstract: В данной статье рассматривается смесь гауссовских распределений выборки. Предполагается, что произвольную функцию распределения можно представить в виде их линейной комбинации. Количество компонент смеси, т.е. число гауссианов в линейной комбинации, произвольно.
BibTeX:
@article{Pavlov2009EMwithAdding,
  author = {Павлов, Кирилл Владимирович},
  title = {EM-алгоритм с последовательным добавлением компонент},
  year = {2009},
  url = {http://www.machinelearning.ru/wiki/index.php?title=EM-%D0%B0%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC_%D1%81_%D0%BF%D0%BE%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%BC_%D0%B4%D0%BE%D0%B1%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5%D0%BC_%D0%BA%D0%BE%D0%BC%D0%BF%D0%BE%D0%BD%D0%B5%D0%BD%D1%82_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Павлов К.В. Разработка алгоритмов ранговой регрессии для кредитного скоринга, 2009. Article
Abstract: Разработка алгоритмов ранговой регрессии для кредитного скоринга
BibTeX:
@article{Pavlov2009Scoring,
  author = {Павлов, Кирилл Владимирович},
  title = {Разработка алгоритмов ранговой регрессии для кредитного скоринга},
  year = {2009},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%A0%D0%B0%D0%B7%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B0%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC%D0%BE%D0%B2_%D1%80%D0%B0%D0%BD%D0%B3%D0%BE%D0%B2%D0%BE%D0%B9_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%B8_%D0%B4%D0%BB%D1%8F_%D0%BA%D1%80%D0%B5%D0%B4%D0%B8%D1%82%D0%BD%D0%BE%D0%B3%D0%BE_%D1%81%D0%BA%D0%BE%D1%80%D0%B8%D0%BD%D0%B3%D0%B0_%28%D0%BE%D1%82%D1%87%D0%B5%D1%82%29}
}
Скипор К.С. Сравнение алгоритмов классификации для кредитного скоринга, 2009. Article
Abstract: Задача кредитного скоринга возникает в банках и в других кредитных организациях при принятии решений о выдаче кредитов. Задача заключается в том, чтобы на основе некоторой информации о заемщике, в данном случае, заполняемая им анкета в банке, обоснованно принять решение — стоит ли ему выдавать кредит, и если да, то на каких условиях.
BibTeX:
@article{Skipor2009Compare,
  author = {Скипор, Константин Станиславович},
  title = {Сравнение алгоритмов классификации для кредитного скоринга},
  year = {2009},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group674/Skipor2009Compare/Docs/Systemdocs.doc}
}
Спирин Н.В. EM алгоритм, 2009. Article
Abstract: EM алгоритм - общий метод нахождения оценок функции правдоподобия в моделях со скрытыми переменными. В данной статье рассматривается интерпретация смеси гауссовых распределений в терминах дискретных скрытых переменных.

Помимо того, что смеси распределений позволяют строить (приближать) сложные вероятностные распеределения, с их помощью можно так же решать задачу кластеризации данных. Далее мы будем решать задачу кластеризации с помощью ЕМ алгоритма, предварительно приблизив решение алгоритмом kMeans.

BibTeX:
@article{Spirin2009EMAlgorithm,
  author = {Спирин, Никита Валерьевич},
  title = {EM алгоритм},
  year = {2009},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group674/Spirin2009EMAlgorithm/Nikita%20Spirin%20EM_Report_Final.pdf}
}
Спирин Н.В. Повышение точности прогнозов на данных Netflix с помощью построения алгоритмических композиций, 2009. Article
Abstract: Boost the performance of existing algorithms on Netflix data with the help of algebraic approach to the synthesis of algorithmic compositions.
BibTeX:
@article{Spirin2009Netflix,
  author = {Спирин, Никита Валерьевич},
  title = {Повышение точности прогнозов на данных Netflix с помощью построения алгоритмических композиций},
  year = {2009},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group674/Spirin2009Netflix/Report/Report%20for%20ML.ru.pdf}
}
Янович Ю.А. Обнаружение жизненного цикла товаров, 2009. Article
Abstract: Цель проекта - прогнозирование еженедельных покупок товаров. Горизонт прогнозирования - одна неделя.
BibTeX:
@article{Yanovich2009LifeCycle,
  author = {Янович, Юрий Александрович},
  title = {Обнаружение жизненного цикла товаров},
  year = {2009},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group674/Yanovich2009LifeCycle/Docs/Systemdocs.doc}
}
Янович Ю.А. Метод k взвешенных ближайших соседей, 2009. Article
Abstract: K взвешенных ближайших соседей - это метрический алгоритм классификации, основанный на оценивании сходства объектов. Классифицируемый объект относится к тому классу, которому принадлежат ближайшие к нему объекты обучающей выборки.
BibTeX:
@article{Yanovich2009WeightedKNN,
  author = {Янович, Юрий Александрович},
  title = {Метод k взвешенных ближайших соседей},
  year = {2009},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_k_%D0%B2%D0%B7%D0%B2%D0%B5%D1%88%D0%B5%D0%BD%D0%BD%D1%8B%D1%85_%D0%B1%D0%BB%D0%B8%D0%B6%D0%B0%D0%B9%D1%88%D0%B8%D1%85_%D1%81%D0%BE%D1%81%D0%B5%D0%B4%D0%B5%D0%B9_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Юдаев М.Д. Оптимальное прореживание нейронных сетей, 2009. Article
BibTeX:
@article{Yudaev2009OBD,
  author = {Юдаев, Михаил Дмитриевич},
  title = {Оптимальное прореживание нейронных сетей},
  year = {2009},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%BF%D1%82%D0%B8%D0%BC%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D0%B5_%D0%BF%D1%80%D0%BE%D1%80%D0%B5%D0%B6%D0%B8%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BD%D0%B5%D0%B9%D1%80%D0%BE%D0%BD%D0%BD%D1%8B%D1%85_%D1%81%D0%B5%D1%82%D0%B5%D0%B9_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}
Зайцев А.А. Daily electricity price forecasting report, 2009. Article
Abstract: The goal is to forecast average daily spot price of electricity. Forecasting horizon
(the maximal time segment where the forecast error does not exceed given value)
is supposed to be one month.
For example, one needs precise forecast of electricity consumption for each hour
during the next day to avoid transactions on the balancing market.
Daily time series from 1/1/2003 until now. Time series are weather (average-,
low-, and high daily temperature, relative humidity, precipitation, wind speed,
heating-, and cooling degree day) and average daily price of electricity. There is
no data on electricity consumption and energy units prices. The data on sunrise
and sunset are coming from the internet.
The time series splits into the whole history but the last month and the last
month. The model is created using the first part and tested with the second.
The procedure must be repeated for each month of the last year. The target
function is MAPE (mean absolute percentage error) for given month.
BibTeX:
@article{Zaitsev2009DEPF,
  author = {Зайцев, Алексей Алексеевич},
  title = {Daily electricity price forecasting report},
  year = {2009},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/Group674/Zaitsev2009DEPF/Project%20report.pdf}
}
Зайцев А.А. Метод Парзеновского окна, 2009. Article
Abstract: Метод Парзеновского окна принадлежит к непараметрическим методам классификации и представляет собой одну из возможных реализаций байесовского подхода к решению задачи классификации. Он естественным образом возникает при предположении о байесовости вероятностных распределений объектов. В методе производится классификация объекта по находящимся на некотором расстоянии от него объектах с весом, зависящим от расстояния. Алгоритм имеет ряд параметров, которые будут более детально рассмотрены в последующих разделах.
BibTeX:
@article{Zaitsev2009Parzen,
  author = {Зайцев, Алексей Алексеевич},
  title = {Метод Парзеновского окна},
  year = {2009},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%9F%D0%B0%D1%80%D0%B7%D0%B5%D0%BD%D0%BE%D0%B2%D1%81%D0%BA%D0%BE%D0%B3%D0%BE_%D0%BE%D0%BA%D0%BD%D0%B0_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29}
}

2008

Куракин А.В. Выбор признаков при построении скоринговых карт кредитного займа, 2008. Article
Abstract: Выбор признаков при построении скоринговых карт кредитного займа. Дана выборка — набор векторов описаний клиентов. Признаки (элементы вектора описаний) могут быть в линейных или ранговых шкалах. Указана принадлежность каждого клиента к классу — «вернул» или «не вернул» кредит. Требуется найти набор признаков, который доставляет максимум критерию качества классификации. Поиск выполняется с помощью генетического оптимизационного алгоритма. Параметры алгоритма заданы. Качество классификации — сумма квадратов невязок — определяется на тестовой выборке с усреднением по заданному числу разбиений. Отношение числа элементов обучающей выборки к тестовой задано. (Исходные данные по запросу).
BibTeX:
@article{Kurakin2008Scoring,
  author = {Куракин, Алексей Владимирович},
  title = {Выбор признаков при построении скоринговых карт кредитного займа},
  year = {2008},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/MIPT2006-2010OldProj/Kurakin2008Scoring/%d0%97%d0%b0%d0%b4%d0%b0%d0%bd%d0%b8%d0%b5.doc}
}
Максимов Ю.В. Конструктивное построение множества суперпозиций, 2008. Article
Abstract: Методы индуктивного построения регрессионных моделей, например, метод группового учета аргументов или символьная регрессия, используют в качестве моделей-претендентов различные суперпозиции свободных переменных. В частности, МГУА использует линейные комбинации произведений свободных переменных, а символьная регрессия - их произвольные суперпозиции.
Приведены несколько задач, иллюстрирующих способы построения суперпозиций. Нужно отметить, что примеры суперпозиций не предназначены для интерпретации, так как они являются преобразованиями строк символов.
BibTeX:
@article{Maximov2008Combinations,
  author = {Максимов, Юрий Владимирович},
  title = {Конструктивное построение множества суперпозиций},
  year = {2008},
  url = {http://www.machinelearning.ru/wiki/index.php?title=%D0%9A%D0%BE%D0%BD%D1%81%D1%82%D1%80%D1%83%D0%BA%D1%82%D0%B8%D0%B2%D0%BD%D0%BE%D0%B5_%D0%BF%D0%BE%D1%81%D1%82%D1%80%D0%BE%D0%B5%D0%BD%D0%B8%D0%B5_%D0%BC%D0%BD%D0%BE%D0%B6%D0%B5%D1%81%D1%82%D0%B2%D0%B0_%D1%81%D1%83%D0%BF%D0%B5%D1%80%D0%BF%D0%BE%D0%B7%D0%B8%D1%86%D0%B8%D0%B9}
}
Шавловский М.Б. Прогнозирование цены электроэнергии на 24 часа, 2008. Article
Abstract: Прогнозирование временного ряда. Дан многомерный временной ряд, в котором один остчет времени соответствует одному часу. Известно, что ряд имеет три периода: 24, 7*24, 365*24. Требуется построить алгоритм прогноза на 24 отсчета вперед. Прогноз выполняется с помощью линейной регрессии. Дополнительно используется библиотека нелинейных безпараметрических преобразований свободных переменных. Свободные переменные (признаки) выбираются с помощью многорядного МГУА. При выполнении вычислительного эксперимента необходимо выбрать несколько лучших моделей и сравнить прогнозы, сделанные с их помощью. Для этого вычисляется ошибка на прогнозе и строится график. (Исходные данные и список библиотечных функций по запросу).
BibTeX:
@article{Shavlovsky2008AutoRegession,
  author = {Шавловский, Михаил Борисович},
  title = {Прогнозирование цены электроэнергии на 24 часа},
  year = {2008},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/MIPT2006-2010OldProj/Shavlovsky2008AutoRegession/%d0%97%d0%b0%d0%b4%d0%b0%d0%bd%d0%b8%d0%b5.docx}
}
Тутунов Р.И. Нахождение базовой модели, 2008. Article
Abstract: Даны три выборки, в которых есть одна свободная и одна зависимая переменная.

Известны следующие факты:

1) Известно, что зависимость переменных во всех трех выборках описывается с помощью некоторой многомерной линейной регрессионной модели.
2) Известно, что модель содержит некоторые мономы не более 3-й степени от свободной переменной, ее тангенса, экспоненты и синуса.
3) Известно, что зависимая переменная есть случайная величина, распределение которой принадлежит экспоненциальному семейству.

Требуется указать модель, которая описывает зависимости выборок, найти ее параметры, и указать распределение зависимой переменной каждой выборки.

BibTeX:
@article{Tutunov2008Exponential,
  author = {Тутунов, Расул Исаевич},
  title = {Нахождение базовой модели},
  year = {2008},
  url = {https://svn.code.sf.net/p/mlalgorithms/code/MIPT2006-2010OldProj/Tutunov2008Exponential/Report.docx}
}