混合模型
-
LLM | Yuan 2.0-M32:带注意力路由的专家混合模型
AI2推理挑战(ARC)基准是一个多选QA数据集,包含从3年级到9年级科学考试的问题。它分为简单和挑战两部分,后者包含需要进一步推理的更复杂部分。论文在挑战部分测试论文的模型。
-
Mixtral:数据流中的生成式稀疏专家混合模型
本文探索如何通过Mistral AI公司的开放模型使用新型 GenAI LLM 与数据流管道构建实时 LLM 管道。该模型可以由轻量级无服务器REST API或Transformer库运行。