Toggle Dark/Light/Auto mode Toggle Dark/Light/Auto mode Toggle Dark/Light/Auto mode

AI git commit generator

В создании коммитов, да и тегов, для гита самое сложное — придумать ёмкое описание, чтобы оно включало все важные аспекты изменений. А ещё это нужно сделать в правильном формате и на грамотном английском. Поэтому в какой-то момент я просто взял и сделал bash-утилиты, использующие AI для этих вещей: gitai для коммитов и gitaitag для тегов. О них и расскажу ниже. AI для коммитов и тегов: gitai и gitaitag Что это такое?
Read full post gblog_arrow_right

Получение распределений в задачах регрессии

Приводится алгоритм нахождения функций распределения в качестве решения задачи регрессии. В общем виде задачу регрессии можно сформулировать как восстановление зависимости $\phi: X \to L_1(\Omega)$, сопоставляющей элементам некоторого фазового пространства $X$ случайную величину $\xi \in L_1(\Omega)$. Классический подход к решению задачи регрессии состоит в нахождении среднего значения $E[\phi(x)]$ для каждого $x \in X$. В статье предлагается простой алгоритм оценки распределений случайных величин $\phi(x) \in L_1(\Omega)$. GitHub Мотивация Описание подхода Постановка задачи Построение модели Ограничения Итоговый алгоритм Валидация Эксперименты Заключение Мотивация В анализе данных значительное место занимают два класса задач — задачи классификации и регрессии.
Read full post gblog_arrow_right

Определение угла наклона текста на сканированных изображениях

При оптическом распознавании текста на сканированных документах качество распознавания зависит от того, наклонён ли текст в документе. У выровненных документов качество распознавания заметно лучше. Соответственно, возникает практическая необходимость в средствах автоматического выравнивания угла наклона текста. В статье предлагается простой, универсальный и достаточно эффективный алгоритм выравнивания наклона текста, основанный на идее минимизации средней энтропии строк и столбцов растрового изображения. Идея Эксперимент Алгоритм Ссылки Идея Базовая идея алгоритма состоит в том, что при повороте текста на сканированном изображении средняя, по строкам и столбцам, энтропия распределения пикселей должна возрасти.
Read full post gblog_arrow_right