寻找中间立场
Posted: Mon Feb 17, 2025 8:51 am
这涉及许多人为参与的过程,其中人类手动纠正输出,或从 生成的选项列表中选择最佳响应。
长期以来,“端到端”是一个产出很少的研究方向,尤其是在我从事了 年多的对话式人工智能领域。很难评估生成式对话模型并看到进展,因此我们诉诸于更传统的构建块方法,其中每个机器学习模型负责一个非常具体的任务,并且可以相当好地完成它。随着训练人工智能模型所需硬件的重大进步和 技术的发现,越来越多的人从构建块方法 法国手机号码数据 转向“端到端”学派,我们现在看到这些“端到端”解决方案取得了令人印象深刻且前所未有的进展,然而,在我们能够从这项技术本身中获得可靠的结果之前,还有很长的路要走。
虽然端到端范式因多种原因而颇具吸引力,但在许多情况下,企业范围内的采用速度实在太快。由于大型模型可能是黑匣子,因此调整模型架构的过程可能极其困难。为了控制大型语言模型,人们常常被迫求助于传统方法,例如插入一些轻量级的基于规则的算法。虽然钟摆已经从小型模型摆向大型模型,但最有效的方法可能介于两者之间。
这一趋势明显体现在 生成式人工智能例如。 首席执行官 表示,下一代模型不会更大。相反,它们实际上会更小,更有针对性。虽然大型语言模型最擅长生成自然或流畅的文本,但任何事实最好来自不同的子系统。从长远来看,这些子系统的职责可能会转移回大型语言模型。但与此同时,我们看到了向更传统方法的轻微回归。
长期以来,“端到端”是一个产出很少的研究方向,尤其是在我从事了 年多的对话式人工智能领域。很难评估生成式对话模型并看到进展,因此我们诉诸于更传统的构建块方法,其中每个机器学习模型负责一个非常具体的任务,并且可以相当好地完成它。随着训练人工智能模型所需硬件的重大进步和 技术的发现,越来越多的人从构建块方法 法国手机号码数据 转向“端到端”学派,我们现在看到这些“端到端”解决方案取得了令人印象深刻且前所未有的进展,然而,在我们能够从这项技术本身中获得可靠的结果之前,还有很长的路要走。
虽然端到端范式因多种原因而颇具吸引力,但在许多情况下,企业范围内的采用速度实在太快。由于大型模型可能是黑匣子,因此调整模型架构的过程可能极其困难。为了控制大型语言模型,人们常常被迫求助于传统方法,例如插入一些轻量级的基于规则的算法。虽然钟摆已经从小型模型摆向大型模型,但最有效的方法可能介于两者之间。
这一趋势明显体现在 生成式人工智能例如。 首席执行官 表示,下一代模型不会更大。相反,它们实际上会更小,更有针对性。虽然大型语言模型最擅长生成自然或流畅的文本,但任何事实最好来自不同的子系统。从长远来看,这些子系统的职责可能会转移回大型语言模型。但与此同时,我们看到了向更传统方法的轻微回归。