fosstodon.org is one of the many independent Mastodon servers you can use to participate in the fediverse.
Fosstodon is an invite only Mastodon instance that is open to those who are interested in technology; particularly free & open source software. If you wish to join, contact us for an invite.

Administered by:

Server stats:

8.6K
active users

#computer_vision

0 posts0 participants0 posts today

AutismSmartDetector: Система для определения черт аутистического спектра

Оригинал материала Проект "AutismSmartDetector" представляет собой инновационную систему на основе искусственного интеллекта, предназначенную для автоматического определения черт аутистического спектра по фотографиям лиц. Система использует свёрточную нейронную сеть (CNN), обученную на большом наборе данных, чтобы классифицировать изображения на две категории: "Autistic" и "Non-Autistic". Преимущества для различных отраслей Для врачей и медицинских учреждений Ранняя диагностика : Система позволяет врачам быстро и эффективно проводить предварительную оценку пациентов на наличие аутистических черт, что способствует ранней диагностике и своевременному началу лечения. Улучшение качества обслуживания : Автоматизация процесса диагностики позволяет врачам сосредоточиться на более сложных случаях и уделить больше времени пациентам. Повышение точности : Использование искусственного интеллекта снижает вероятность ошибок в диагностике, что повышает точность и надежность результатов. Для финансовых организаций Оценка рисков : Система может использоваться для оценки рисков при выдаче кредитов или страховых полисов, учитывая особенности поведения и состояния здоровья клиентов. Персонализация услуг : Финансовые организации могут предлагать персонализированные услуги и продукты, учитывая индивидуальные особенности клиентов. Для цифровых экосистем Улучшение пользовательского опыта : Система может быть интегрирована в платформы для улучшения пользовательского опыта, предлагая персонализированные рекомендации и услуги. Анализ поведения пользователей : Анализ черт аутистического спектра может помочь в понимании поведения пользователей и адаптации интерфейсов и сервисов под их потребности. Для соцсетей Безопасность и модерация : Система может использоваться для модерации контента и обеспечения безопасности пользователей, особенно тех, кто может быть уязвим из-за особенностей поведения. Персонализация контента : Социальные сети могут предлагать персонализированный контент и рекомендации, учитывая индивидуальные особенности пользователей. Для сервисов знакомств Персонализация рекомендаций : Система может помочь в подборе партнеров, учитывая индивидуальные особенности и потребности пользователей. Безопасность и защита : Сервисы знакомств могут использовать систему для защиты пользователей от мошенников и недобросовестных участников. Основные возможности Обучение модели : Обучение модели на основе данных, собранных из различных источников. Предсказание по одному изображению : Возможность загрузки и анализа одного изображения для определения наличия аутистических черт. Предсказание по множеству изображений : Анализ нескольких изображений одновременно. Предсказание по URL : Возможность анализа изображений, загруженных по URL.

habr.com/ru/articles/934074/

ХабрAutismSmartDetector: Система для определения черт аутистического спектраОригинал материала Оригинал фото Проект "AutismSmartDetector" представляет собой инновационную систему на основе искусственного интеллекта, предназначенную для автоматического определения черт...

Часть 2: Rope-Ladder Tracker — от идеи к стабильной системе

Это продолжение статьи “Rope-Ladder Tracker: визуальный возврат без GPS” , где я представил концепцию структурированного позиционирования по принципу “верёвочной лестницы”. Тогда это была идея, прототип и первые кадры. Сегодня — полноценная, стабильная система, готовая к интеграции в реальный дрон.

habr.com/ru/articles/933046/

#c++ #python #computer_vision #opencv #научнопопулярное #научпоп

ХабрЧасть 2: Rope-Ladder Tracker — от идеи к стабильной системеЭто продолжение статьи “Rope-Ladder Tracker: визуальный возврат без GPS” , где я представил концепцию структурированного позиционирования по принципу “верёвочной лестницы”. Тогда это была идея,...

Когда несколько пикселей решают всё: One Pixel атака и способы защиты от неё

Удивительно, но факт: несколько изменений в изображении могут полностью поменять вывод нейросети, что ломает заложенную разработчиком логику. В данной статье мы не просто подсветим факт существования One Pixel атаки, но и комплексно разберём архитектурные факторы, которые влияют на устойчивость CV-систем к данному семейству атак.

habr.com/ru/articles/932934/

ХабрКогда несколько пикселей решают всё: One Pixel атака и способы защиты от неёУдивительно, но факт: несколько изменений в изображении может полностью изменить вывод нейросети, что ломает заложенную разработчиком логику. В данной статье мы не просто подсветим факт существования...

Как я научил квадрокоптер возвращаться домой без GPS: алгоритм «верёвочной лестницы»

Представьте: квадрокоптер летает в ангаре, на складе или в квартире. GPS не ловит , а барометр и гироскоп дают дрейф в позиции . Что остаётся?

habr.com/ru/articles/932254/

ХабрКак я научил квадрокоптер возвращаться домой без GPS: алгоритм «верёвочной лестницы»🚀 Проблема: GPS нет, дрейф есть Представьте: квадрокоптер летает в ангаре, на складе или в квартире. GPS не ловит , а барометр и гироскоп дают дрейф в позиции . Что остаётся? Оптический поток —...

Anchor Optical TrackeR Update: Улучшенная система трекинга с адаптивной стабилизацией при ветре

Спустя время после публикации первой версии Anchor Optical TrackeR, провел значительное улучшение системы трекинга, добавив адаптивные механизмы, повышающие устойчивость к внешним воздействиям, особенно к ветровым нагрузкам. В новой версии реализована интеллектуальная система управления путевыми точками по принципу "веревочной лестницы" и адаптивное увеличение плотности точек при обнаружении сильного ветра.

habr.com/ru/articles/930542/

ХабрAnchor Optical TrackeR Update: Улучшенная система трекинга с адаптивной стабилизацией при ветреВведение Спустя время после публикации первой версии Anchor Optical TrackeR, провел значительное улучшение системы трекинга, добавив адаптивные механизмы, повышающие устойчивость к внешним...

Как я написал покер‑бот за 4 недели, используя Cursor + GPT

Мой первый опыт публикации и рассказ о том, как я за четыре недели сделал рабочую альфа-версию покер-бота. В проекте использованы методы Монте-Карло, компьютерное зрение (YOLO), Python и инструменты вроде Cursor и Roboflow. Текст будет полезен новичкам в машинном обучении и компьютерном зрении, тем, кто хочет понять, как связать ИИ, детекцию объектов и покерную математику в одном проекте, а также всем, кто интересуется практическим применением ИИ для создания собственных инструментов.

habr.com/ru/articles/929846/

ХабрКак я написал покер‑бот за 4 недели, используя Cursor + GPT1. Вводная Это мой первый опыт написания статьи. Судим, но не строго. Недавно завершил интересный пэт-проект. Настолько интересный, что захотелось поделиться. Это десктопная программа, которая:...

VisionPilot: автономный автопилот на Betaflight и Orange Pi 5 с YOLO и ELRS

В эпоху стремительного развития технологий управление становится не просто точным, а интеллектуальным и адаптивным в режиме реального времени. Использование визуального трекинга для корректировки управляющих каналов по протоколу CRSF открывает новые горизонты в повышении стабильности и эффективности управления даже в самых сложных условиях. Эта концепция уже воплощена в проекте VisionPilot — автономном автопилоте на базе Betaflight и Orange Pi 5 с аппаратным ускорением YOLO и управлением через ELRS. VisionPilot — это простой, расширяемый и доступный инструмент, который сочетает мощь нейросетевого обнаружения объектов и надёжность протокола управления для создания настоящей автономии.

habr.com/ru/articles/928514/

ХабрVisionPilot: автономный автопилот на Betaflight и Orange Pi 5 с YOLO и ELRS🚀 Введение VisionPilot — простая, независимая и расширяемая система автономного автопилота, созданная в качестве примера на базе следующих компонентов: Betaflight (полетный контроллер) Orange Pi 5 с...

Готовимся к собесу: positional encodings в 2025 году

Если вы до сих пор считаете, что positional encoding в трансформерах — это знаменитые sin/cos из статьи 2017 года, то боюсь, что собеседование для вас закончится автоматическим реджектом. Позиционное кодирование заметно эволюционировало с момента появления оригинальной статьи о трансформерах. В современных LLM и моделях компьютерного зрения, таких как FLUX, уже давно не используется классическое sin/cos-кодирование.

habr.com/ru/articles/926368/

ХабрГотовимся к собесу: positional encodings в 2025 годуЕсли вы до сих пор считаете, что positional encoding в трансформерах — это знаменитые sin/cos из статьи 2017 года, то боюсь, что собеседование для вас закончится автоматическим реджектом. Позиционное...

Я построил Vision Transformer с нуля — и научил его обращать внимание

В этой статье я не просто объясню, что такое ViT — я покажу вам, как создать эту магию своими руками, шаг за шагом, даже если вы никогда раньше не работали с трансформерами для задач с изображениями.

habr.com/ru/articles/925050/

ХабрЯ построил Vision Transformer с нуля — и научил его обращать вниманиеVision Transformer (ViT) — это архитектура, которая буквально произвела революцию в том, как машины «видят» мир. В этой статье я не просто объясню, что такое ViT — я покажу вам, как создать эту магию...

Компьютерное зрение в сельском хозяйстве

Интеллектуальные системы, основанные на компьютерном зрении, проникли практически во все сферы жизни современного человека. Эти системы объединяют компьютерное зрение, искусственный интеллект (ИИ) и технологии машинного обучения и позволяют машинам имитировать зрительные и когнитивные способности человека для принятия обоснованных решений по поставленной задаче. Технология компьютерного зрения используется для обработки и интерпретации визуальной информации из окружающей среды, а технологии искусственного интеллекта (ИИ) вместе с алгоритмами машинного обучения применяются для распознавания закономерностей и прогнозирования действий. Эти интеллектуальные системы улучшают производительность за счет обучения с течением времени. В этой статье мы рассмотрим использование компьютерного зрения в земледелии. Мы рассмотрим различные этапы так называемого цифрового сельского хозяйства, включая получение изображений, объединение и анализ изображений, принятие решений с помощью машинного обучения.

habr.com/ru/companies/otus/art

ХабрКомпьютерное зрение в сельском хозяйствеИнтеллектуальные системы, основанные на компьютерном зрении, проникли практически во все сферы жизни современного человека. Эти системы объединяют компьютерное зрение, искусственный...

Компьютерное зрение для начинающих

Тема компьютерного зрения наряду с искусственным интеллектом в последние годы стала очень популярной. Сегодня компьютерное зрение — это динамичная и быстро развивающаяся область, постоянно расширяющая границы того, что могут видеть и понимать машины. Однако, зачастую многие публикации посвященные computer vision являются достаточно сложными для тех, кто только погружается в данную тему. В этой статье мы поговорим о том, как все это работает и какие основные технологии и алгоритмы используются. Мы не будем глубоко погружаться в вопросы, связанные с реализацией методов компьютерного зрения, так как задача этой статьи объяснить основные принципы.

habr.com/ru/companies/otus/art

ХабрКомпьютерное зрение для начинающихТема компьютерного зрения наряду с искусственным интеллектом в последние годы стала очень популярной. Сегодня компьютерное зрение — это динамичная и быстро развивающаяся область,...

Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением

Привет, Хабр! Мы – Даниил Соловьев и Михаил Никитин из команды направления распознавания лиц. Сегодня фокусируемся на задаче распознавания лиц на изображениях низкого разрешения (low resolution face recognition, low-res FR). Она актуальна в первую очередь при анализе данных видеонаблюдения, так что если перед вами сейчас стоит подобная задача (или просто интересно, как она решается) — статья для вас. Расскажем про проблемы и сложности распознавания лиц низкого разрешения, подходы к решению задачи, в том числе свежий PETALface с конференции WACV 2025 . Также поделимся ссылками на исследования, которые подробнее освещают каждый подход.

habr.com/ru/companies/tevian/a

ХабрЭто камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением"Распознать бы этого шакала" Привет, Хабр! Мы – Даниил Соловьев и Михаил Никитин из команды направления распознавания лиц. Сегодня фокусируемся на задаче распознавания лиц на изображениях низкого...

Один кадр против спуфинга: как мы определяем фейковые лица без видео и биометрии

Иногда пользователи пытаются пройти биометрическую верификацию не совсем честно. Иногда — совсем нечестно. Кто-то показывает фото на экране другого телефона, кто-то — печатает лицо на бумаге и машет им в камеру. Всё это — спуфинг, и он давно вышел из лабораторий и научных статей в суровую продакшен-практику. А задача при этом, казалось бы, простая: по одному кадру понять, есть ли перед камерой живой человек. Ни видео, ни поведенческой биометрии, ни инфракрасных сенсоров. Просто JPEG. Просто ад. Все о спуфинге и методах борьбы с ним знает наш разработчик Александр. Он работает над проектом антиспуфинг-системы, способной по изображению с фронталки отличать живого человека от картинки. В этой статье мы расскажем, как он научил систему это делать. Без волшебства: только кастомный датасет, ансамбль CNN и несколько костылей — куда без них.

habr.com/ru/articles/921390/

ХабрОдин кадр против спуфинга: как мы определяем фейковые лица без видео и биометрииИногда пользователи пытаются пройти биометрическую верификацию не совсем честно. Иногда — совсем нечестно. Кто-то показывает фото на экране другого телефона, кто-то — печатает лицо на бумаге и машет...

Залезаем на плечи гигантов — создаем модуль для ComfyUI для свободного движения камеры и создание 6dof сцен из фото

Всем привет! Я много работаю с видео для виртуальной реальности, и одна из задач, которая всё ещё маячит на горизонте и требует уймы усилий — удобное создание и стриминг полноценного 6Dof видео . Большинство существующих решений сводятся к двум крупным направлениям. В этой статье мы рассмотрим, как расширить возможности генеративных моделей для виртуальной реальности (VR), создав модуль для ComfyUI, который позволит: преобразовывать изображения и видео между pinhole , fisheye и equirectangular проекциями; итеративно дорисовывать панорамы до полного сферического охвата; синтезировать новые ракурсы свободным движением камеры в 3‑D‑пространстве. Я покажy, как объединить продвинутый reprojection grid_sample с outoainting, картами глубины и облаками точек, чтобы получить реалистичные «новые виды» из одного изображения. Кроме того совместим этот подход с подходом Video Generation

habr.com/ru/articles/912652/

ХабрЗалезаем на плечи гигантов — создаем модуль для ComfyUI для свободного движения камеры и создание 6dof сцен из фотоКрутим Fisheye камеру в синтезированном мире Всем привет! Я много работаю с видео для виртуальной реальности, и одна из задач, которая всё ещё маячит на горизонте и требует уймы усилий — удобное...

Kandinsky 4.1 Image – новый генератор изображений от Сбера

В декабре прошлого года на конференции AI Journey наша команда представила диффузионную генеративную модель Kandinsky 4.0 Video. Теперь мы рады представить новую версию нашей модели генерации изображений Kandinsky 4.1 Image!

habr.com/ru/companies/sberbank

ХабрKandinsky 4.1 Image – новый генератор изображений от СбераВ декабре прошлого года на конференции AI Journey наша команда представила  диффузионную генеративную модель Kandinsky 4.0 Video ( статья на habr ). Теперь мы рады представить новую версию нашей...

Генерация видео: Обзор интересных подходов | Text-2-video | Part 2

Освечу базовые концепты из области генерации видео, в этой части разберем уже более современные модели 2025 года, и парочку моделей, с которых все начиналось. Все кратко и четко, только самое основное. Посмотрим на устройство современных топовых SOTA моделей для генерации видео: Wan2.1, Hunyuan video, недавно вышедший подход к облегчению вычислетильных требования FramePack.

habr.com/ru/articles/912522/

ХабрГенерация видео: Обзор интересных подходов | Text-2-video | Part 2Освещу базовые концепты в области генерации видео. В этой части рассмотрю как современные модели 2025 года, так и несколько ключевых архитектур, с которых всё начиналось. Всё кратко и по делу — только...