随着 ChatGPT 的横空出世,瞬间点燃全球 AI 产业的希望之火,AI 大模型吸引了大批科技巨头、初创企业与科研院所入场。同时也引发了这个刚刚崛起的新兴产业的深度思考,大模型公司到底该怎么做?有的认为应该专注基础大模型技术开发,有的认为技术开发非常难,完全可以只做纯应用。在众说纷纭下,国内头部大模型企业百川智能给出了参考答案,既要掌握大模型的底层技术也要做超级应用。
陈炜鹏 百川智能技术联合创始人
双轮驱动,大模型的技术与超级应用
不久前,百川智能正式发布其最新一代基座大模型Baichuan 4 及首款 AI 助手“百小应”。“百小应”的推出,体现了百川智能通过基础大模型的技术赋能超级应用的发展战略。百川智能技术联合创始人陈炜鹏表示,“百川智能将继续探索和突破技术边界,不断提升大模型的性能,尤其是在通用性、数学和代码能力、多模态处理等方面。保持公司在人工智能领域的竞争优势。双轮驱动,为技术找到合适场景,通过基础大模型的技术赋能与超级应用,从创造、健康、快乐三个维度为用户和合作伙伴创造更多价值。”
百川智能提供了MaaS+AaaS(Model as aService + Agent as a Service)的商业服务,为企业提供生产力、生产效率的提升,让企业更便捷地利用AI 技术,加速智能化转型。
大模型的技术创新与落地应用
作为国内较早开始研发大模型的公司,百川智能在技术创新和落地应用方面有着非常多的经验与话语权,百川智能技术联合创始人陈炜鹏认为,“在技术创新方面,模型的参数规模、多模态融合能力,可解释性和透明度在持续演进,在落地应用上,大模型的参数规模一方面在持续扩大,拉伸 AGI 的能力上限,解决复杂场景的落地问题,另一方面不断提升小模型的能力上限,满足端侧或者垂直应用场景的落地也是重要的趋势。”大模型正从单一模态(如文本)向多模态(文本、图像、声音等)融合发展,以实现更丰富的交互和理解能力,不断扩大模型的能力边界和应用场景。
随着技术的成熟和市场需求的增长,大模型的商业化应用正在加速,尤其是在金融、医疗、教育等领域。
大模型发展面临的三大挑战:数据、算力、安全
大模型开放、AIGC 深度应用,不仅对数据、算法、算力提出了更高要求,也对安全、隐私、伦理提出了更多挑战。陈炜鹏认为:大模型发展面临的最大挑战主要是数据、算力、安全等问题。数据是大模型训练的基础,获取和构建高质量、多样化的数据是主要挑战,需要通过引入多样数据和合成数据等方式来解决。其次,大模型的参数规模巨大,使得理解模型内部决策过程变得复杂,如果理解模型的决策机理,提升模型的可解释性和透明度,尤其是在可控高的场景,是一个关键的问题。
最后,持续提升模型的规划能力,借助 self-play 等方式持续提升模型的长程规划能力,也是重要的问题。
(智能网原创,转载请注明来源)