Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Познакомьтесь с нашей новейшей нано-моделью: LFM2-ColBERT-350M ⚛️
С всего лишь 350M параметров, LFM2-ColBERT-350M позволяет вам хранить документы на одном языке и извлекать их на многих языках с высокой точностью и скоростью вывода моделей, которые составляют лишь малую часть его размера.
> Лучший кросс-языковой извлекатель в классе до 500M
> Превосходит более крупные модели на немецком, арабском, корейском, испанском, португальском, итальянском, французском и японском языках
> Работает на уровне гораздо более крупных моделей на английском
> Компактный дизайн 350M готов для извлечения в больших масштабах и на устройствах
> Линейно масштабируется с размером пакета, поддерживая более 1K документов в секунду при кодировании документов
1/n 🧵

LFM2-350M-ColBERT обеспечивает скорость вывода на уровне моделей, которые в 2,3 раза меньше, при этом сохраняя высокую точность на девяти языках.
2/n

LFM2-ColBERT-350M использует позднее взаимодействие.
Большинство исследований по извлечению информации сосредоточено на би-кодерах или повторных ранжировщиках. Позднее взаимодействие сочетает в себе сильные стороны обоих, сохраняя эффективность отдельных кодеров и восстанавливая точность на уровне токенов.
> Сохраняет детализированные взаимодействия без полного перекрестного внимания
> Поддерживает заранее вычисленные встраивания документов для масштабируемости
> Балансирует точность и скорость в многоязычном извлечении
3/n

50,78K
Топ
Рейтинг
Избранное

