Toggle Dark/Light/Auto mode Toggle Dark/Light/Auto mode Toggle Dark/Light/Auto mode

Получение распределений в задачах регрессии

Приводится алгоритм нахождения функций распределения в качестве решения задачи регрессии. В общем виде задачу регрессии можно сформулировать как восстановление зависимости $\phi: X \to L_1(\Omega)$, сопоставляющей элементам некоторого фазового пространства $X$ случайную величину $\xi \in L_1(\Omega)$. Классический подход к решению задачи регрессии состоит в нахождении среднего значения $E[\phi(x)]$ для каждого $x \in X$. В статье предлагается простой алгоритм оценки распределений случайных величин $\phi(x) \in L_1(\Omega)$. GitHub Мотивация Описание подхода Постановка задачи Построение модели Ограничения Итоговый алгоритм Валидация Эксперименты Заключение Мотивация В анализе данных значительное место занимают два класса задач — задачи классификации и регрессии.
Read full post gblog_arrow_right

Определение угла наклона текста на сканированных изображениях

При оптическом распознавании текста на сканированных документах качество распознавания зависит от того, наклонён ли текст в документе. У выровненных документов качество распознавания заметно лучше. Соответственно, возникает практическая необходимость в средствах автоматического выравнивания угла наклона текста. В статье предлагается простой, универсальный и достаточно эффективный алгоритм выравнивания наклона текста, основанный на идее минимизации средней энтропии строк и столбцов растрового изображения. Идея Эксперимент Алгоритм Ссылки Идея Базовая идея алгоритма состоит в том, что при повороте текста на сканированном изображении средняя, по строкам и столбцам, энтропия распределения пикселей должна возрасти.
Read full post gblog_arrow_right