Percakapan alami mencakup interupsi dan pembicaraan tentang orang, yang sulit bagi LLM untuk dimodelkan sebagai urutan autoregresif tunggal. Saya yakin Anda bisa melangkah cukup jauh dengan membuat urutan teks dengan skrip film seperti jeda di tengah kalimat, tetapi sepertinya solusi sebenarnya akan melibatkan aliran paralel mendengarkan dan berpikir dengan berbicara mengantri untuk jeda atau naik ke prioritas interupsi. Mencampur token dari aliran yang berbeda dan melakukan sesuatu yang khusus dengan perhatian tampaknya masuk akal.
178,05K