Познакомьтесь с нашей новейшей нано-моделью: LFM2-ColBERT-350M ⚛️ С всего лишь 350M параметров, LFM2-ColBERT-350M позволяет вам хранить документы на одном языке и извлекать их на многих языках с высокой точностью и скоростью вывода моделей, которые составляют лишь малую часть его размера. > Лучший кросс-языковой извлекатель в классе до 500M > Превосходит более крупные модели на немецком, арабском, корейском, испанском, португальском, итальянском, французском и японском языках > Работает на уровне гораздо более крупных моделей на английском > Компактный дизайн 350M готов для извлечения в больших масштабах и на устройствах > Линейно масштабируется с размером пакета, поддерживая более 1K документов в секунду при кодировании документов 1/n 🧵
LFM2-350M-ColBERT обеспечивает скорость вывода на уровне моделей, которые в 2,3 раза меньше, при этом сохраняя высокую точность на девяти языках. 2/n
LFM2-ColBERT-350M использует позднее взаимодействие. Большинство исследований по извлечению информации сосредоточено на би-кодерах или повторных ранжировщиках. Позднее взаимодействие сочетает в себе сильные стороны обоих, сохраняя эффективность отдельных кодеров и восстанавливая точность на уровне токенов. > Сохраняет детализированные взаимодействия без полного перекрестного внимания > Поддерживает заранее вычисленные встраивания документов для масштабируемости > Балансирует точность и скорость в многоязычном извлечении 3/n
50,78K