fosstodon.org is one of the many independent Mastodon servers you can use to participate in the fediverse.
Fosstodon is an invite only Mastodon instance that is open to those who are interested in technology; particularly free & open source software. If you wish to join, contact us for an invite.

Administered by:

Server stats:

10K
active users

#multimodality

0 posts0 participants0 posts today

[Перевод] Spring AI научился видеть! Показываю, как заставить GPT находить бананы на картинках

Новый перевод от команды Spring АйО расскажет вам о работе с мультимодальностью при работе со Spring AI и о различных вариантах работы с графическими изображениями с использованием искусственного интеллекта.

habr.com/ru/companies/spring_a

ХабрSpring AI научился видеть! Показываю, как заставить GPT находить бананы на картинкахНовый перевод от команды Spring АйО расскажет вам о работе с мультимодальностью при работе со Spring AI и о различных вариантах работы с графическими изображениями с использованием искусственного...

Kandinsky 4.0 — новая модель генерации видео

Сегодняшний релиз хочется начать с небольшой истории семейства моделей Kandinsky. В прошлом году на конференции AI Journey 2023 наша команда представила две модели: Kandinsky 3.0 для генерации изображений и первую российскую модель генерации видео по тексту Kandinsky Video . В этом году в апреле и мае вышли в свет улучшенные версии этих моделей: Kandinsky 3.1 с повышенным качеством изображений и Kandinsky Video 1.1 с улучшенными визуальным качеством и временной связностью кадров на видео. С тех пор прогресс в области генеративных моделей привел к созданию множества интересных решений для задач генерации, связывающих текст, видео и аудио модальности. Сегодня наша команда исследователей и учёных из Лаборатории Sber AI Research при поддержке учёных Лаборатории FusionBrain Института AIRI представляет Kandinsky 4.0 — нейросеть нового поколения для создания реалистичных видеороликов по текстовому описанию или стартовому кадру, а также аудио сопровождения для сгенерированного видеоролика. Теперь модель генерирует видеоряд продолжительностью до 12 секунд в разрешении HD (1280x720) по любому текстовому описанию или произвольному стартовому кадру. С помощью модели можно создавать видео с разным соотношением сторон под любые пользовательские и продуктовые потребности. В этой статье мы подробно рассмотрим структуру, функционал и процесс обучения нашей новой модели.

habr.com/ru/companies/sberbank

ХабрKandinsky 4.0 — новая модель генерации видеоСегодняшний релиз хочется начать с небольшой истории семейства моделей Kandinsky. В прошлом году на конференции AI Journey 2023 наша команда представила две модели: Kandinsky 3.0 для генерации...

“Walking is still honest,” yet in the global South, it’s more than that: It’s essential; the only mode available to the vast majority. Despite this, streets cater to cars.

buff.ly/3AR8ftX
Xitter @CVRecord
#sustainabletransport #transportation #ActiveMobility #ActiveTransport #mobility #multimodal #Multimodality #TransportationJustice #Walking #TrufiAssociation

Comox Valley Record · Walking is still honestBy Marc Kitteringham

Job Opening: Post-doctoral researcher in Computer Science or Digital Humanities at the University of Helsinki. Join the ERC-funded project on multimodality starting in Jan 2025.
Apply by Oct 21, 2024.
More info: jobs.helsinki.fi/job-invite/35 @tuomo
#PostDoc #DigitalHumanities #Multimodality

jobs.helsinki.fiPost-doctoral researcher in computer science or digital humanitiesPost-doctoral researcher in computer science or digital humanities

Hey! I have a four-year post-doc position in computer science or #digitalhumanities in my ERC CoG project, which focuses on the #multimodality of human communication.

This time I'm looking for someone with experience in information retrieval / knowledge graphs.

Please share the announcement widely – for more details, see the announcement here: jobs.helsinki.fi/job-invite/35

jobs.helsinki.fiPost-doctoral researcher in computer science or digital humanitiesPost-doctoral researcher in computer science or digital humanities