Самарская IT-компания «Открытый код» разработала библиотеку подпрограмм для понимания и генерации текста на основе технологий машинного обучения (SDK). Сейчас она дает подсказки, создает шаблоны при составлении документов, генерирует и анализирует их. Основу SDK используют в муниципальном архиве Самары, единой цифровой платформе областного правительства, системах документооборота ФБУ «Нижегородский ЦСМ» и ОАО «Мосводоканал».
Самарская IT-компания «Открытый код» разработала библиотеку подпрограмм для понимания и генерации текста на основе технологий машинного обучения (SDK). Сейчас она дает подсказки, создает шаблоны при составлении документов, генерирует и анализирует их. На реализацию проекта ушло около пяти лет.
Работу SDK определяют сложные программно-аппаратные комплексы, в основе которых лежат отечественные платформы. В частности, система управления цифровым контентом «ECM-Интеллект». В нее входят функции: накопление информации, анализ «больших данных», получение сведений из некорректных запросов, акцентная визуализация (отметки и пояснения для привлечения внимания), динамически настраиваемые экраны и поддержка принятия решений.
«ЕСМ» ведет журнал и обрабатывает входящие и исходящие документы (рецензирование, подписание, направление), ищет их по реквизитам, настраивает уведомления.
По выкладкам «Открытого кода» «ЕСМ» повышает точность планирования работы на 25%, на 40% сокращает время анализа, а скорость обработки документов — на 300%.
Интеллектуальная технология не ограничена количеством пользователей, серверных станций и временем работы. Сейчас основу SDK используют в муниципальном архиве Самары, единой цифровой платформе областного правительства, системах документооборота ФБУ «Нижегородский ЦСМ» и ОАО «Мосводоканал».
«Открытый код» потому так и называется, что мы изначально реализовали все наши решения на отечественном софте. Это наша принципиальная позиция, которая сейчас особенно показала свою актуальность. Другие наши фишки – это широкое использование искусственного интеллекта, работа со сложными неструктурированными данными, как текстовыми, так и графическими, дополненная и виртуальная реальность и высокая степень защиты информации», – раскрывает о принципах работы руководитель «Открытого кода» Олег Сурнин.
Библиотеки подпрограмм понимания и генерации текстов делятся на три уровня реализации: инфраструктурный (обработка сведений, база знаний), семантический (поиск параметров, сопоставление информации, семантико-статистический анализ), а также поддержка принятия решений (подсказки, шаблоны и генерация документов).
SDK отличается высокой скоростью обработки данных. По сведениям разработчиков, это связано с применением списка алгоритмов машинного обучения и возможностью извлечения информации из корпоративной документации.
«Сложные системы невозможно собрать на коленке за месяц или два. Это многофакторный процесс и работа, как правило, большого коллектива. В компании «Открытый код» в среднем работает около 250 человек. И поверьте, среди них нет ни одного лишнего», – говорит Олег Сурнин.
Он добавил, что количество и стоимость поставки библиотек подпрограмм понимания и генерации текстов зависит от заданных целей и условий заказчика.
«Каждая IT-компания развивает свои компетенции. И каждый из названных мной компонентов входит в инструментарий передовых вендоров рынка. Другой вопрос – как они их применяют? Как увязывают логические и производственные цепочки? Насколько хватает фантазии и смелости по внедрению? В этом же все дело. Так, в проекте с корпорацией «Вертолеты России» мы объединили технологии текстопонимания, семантического анализа и онтологий динамического планирования», – приводит пример внедрения SDK Олег Сурнин.
При этом SDK создает собственные словари синонимов на основе нейронных сетей, исправляет частые ошибки распознавания (например, «и» вместо «й»).
Еще один элемент библиотеки подпрограмм – семантический поиск. В нем сочетается поисковой механизм, распознавание текста, отображение и оценка релевантности результатов и извлечение знаний. «Это явление многофакторное, обрабатывающее сложные логически обоснованные запросы, которые невозможно решить за счет традиционных видов поиска информации», – отметили в презентации проекта представители «Открытого кода».
По мнению Олега Сурнина, западные санкции только «актуализировали» разработку подобных технологий. Он уверяет, отечественные решения способны обойти по качеству зарубежные аналоги.
«Насчет сравнения наших решений с западными хочу сказать следующее: я не ставлю перед нашей компанией задачи по импортозамещению. Считаю, что мы владеем всеми навыками, технологиями и научными подходами, чтобы превзойти стандартные западные системы. Наше ключевое отличие от иностранцев, которые в свое время заполонили российский рынок «коробочными решениями», – в индивидуальной настройке систем. Не допиливание готовой системы под проблемы заказчика, а изначальная, буквально камертонная, настройка под заявленные задачи», – выделяет конкурентное преимущество управляющий «Открытого кода».
По данным Российского фонда развития информационных технологий, который поддержал проект, «Открытый код» вложил в разработку SDK 39,6 млн руб., еще 19,8 млн руб. составила сумма гранта. Там добавили, что выручка от внедрения разработанных компонентов системы составляет 55,4 млн рублей. Сейчас проект завершен и готовится к включению в Единый реестр российских программ для ЭВМ и баз данных.
В Самарском государственном медицинском университете Минздрава России разработаны и производятся сложнопрофильные титановые и керамические эндопротезы. Каждый эндопротез изготавливается индивидуально для пациента по аддитивной технологии — то есть, с помощью послойной печати на 3D-принтере. При этом учитываются анатомические особенности каждого человека. Благодаря этому врачам удается максимально эффективно решить проблему пациента и вернуть его к привычной жизни.
Спасение от инвалидности
Проект, разработанный учеными СамГМУ, позволяет обеспечить эндопротезами пациентов с деструктивно-дистрофическими заболеваниями, опухолями, травмами длинных и коротких костей. Если раньше людей с такими заболеваниями и патологиями ждала инвалидность, то установка индивидуальных эндопротезов позволяет ее избежать.
Сделано в Самаре: вклад региона в научный и технологический суверенитет страны
Перед Россией со всей очевидностью стоит задача обеспечения независимости в политической сфере и экономике. Проект «Сделано в Самаре» посвящен предприятиям, инноваторам и ученым региона, которые работают на усиление научного, технологического и промышленного суверенитета России.
В Самарской области ведут научную деятельность такие институты, как Самарский национальный исследовательский университет имени академика С.П. Королева, Самарский государственный медицинский университет Минздрава России, Тольяттинский государственный университет, Самарский государственный технический университет, Поволжский государственный университет телекоммуникаций и другие.
Среди предприятий, внедряющих передовые технологии и выпускающих импортозамещающую продукцию, не только такие гиганты, как АвтоВАЗ и РКЦ «Прогресс», но и небольшие компании из различных сфер, будь то информационные технологии, медицина, пищепром, ТЭК и химия, агропромышленный сектор, машиностроение. В регионе выстроена система технопарков, вокруг которых концентрируются инновационные производства.
Цель проекта «Сделано в Самаре» — рассказать о тех, кто видит новые возможности и умеет претворять их в жизнь, кто ставит амбициозные задачи и верит в свои силы, кто большими и малыми достижениями, как кирпичиками, выкладывает фундамент суверенитета России.
Лишь некоторые особенности внутренней политики формируют глобальную экономическую сеть и при этом — призваны к ответу. Имеется спорная точка зрения, гласящая примерно следующее: элементы политического процесса ассоциативно распределены по отраслям.