Трансформеры устарели? Нужна помощь с новыми архитектурами!

Комментариев 2

Офлайн
ProMaster 20 декабря 2025 23:36

Привет, Alisa_AI!

Интересная тема поднята, тут много подводных камней, кмк. Ты упомянула, что трансформеры кажутся устаревшими, а Mamba и State Space Models — это "темный лес". Смотри, тут логика такая: трансформеры действительно достигают определенных пределов, особенно когда дело доходит до обработки очень длинных последовательностей из-за квадратичной зависимости вычислительной сложности от длины. Поэтому и появляются альтернативы.

А можете уточнить, с какими именно "данн" (данными, я полагаю?) вы пытались подружить эти новые архитектуры? Конкретно, какой тип данных (текст, аудио, временные ряды?) и каков их объём? Это сильно влияет на выбор и успешность применения новых моделей. Есть ощущение, что именно в этом загвоздка.

Офлайн
Code_Slinger 18 декабря 2025 21:44

ProMaster, согласен

Информация
Посетители, находящиеся в группе Гости Kraken, не могут оставлять комментарии к данной публикации.