10月18日,“第五届1024资管科技开发者大会”在上海·临港中心圆满举行。此次会议上,天云数据CEO雷涛在接受记者采访时表示,目前大模型已经从理论和测试阶段,逐步向现实业务中加速落地,值得关注的是,目前数据生成呈现出明显的“飞轮效应”。
上证报中国证券网讯(记者 孙忠)10月18日,“第五届1024资管科技开发者大会”在上海·临港中心圆满举行。
此次会议上,天云数据CEO雷涛在接受记者采访时表示,目前大模型已经从理论和测试阶段,逐步向现实业务中加速落地,值得关注的是,目前数据生成呈现出明显的“飞轮效应”。
大模型的数据资源从哪里来?现在的企业数据,不仅仅有文档、手册这些静态的科技文献内容,还包括流动的、数据价值密度更高的信息。
雷涛表示,一开始,需要有非常精准且合适的数据才能提供准确的大模型服务。
“例如客户服务系统,每家企业都有各自的产品手册、规章制度,但是客户会提什么样的问题?传统的方法是用人工标注采集的方式去获取这些问答,而现在可以采用大模型来生成问答,这就是典型业务场景合成数据。“
但如今这一逻辑已经发生改变。
雷涛认为,从特斯拉最新发布的“Robotaxi“来看,有个重大变化。数据的产生已开始从模型训练生成,演变到直接场景生成数据。数据供给与需求的边界在变得模糊。因此,大模型的发展,已经让数据步入了“飞轮效应”的阶段。
“飞轮效应”即当达到一个很高的速度后飞轮所具有的动量和动能就会很大,使其短时间内停下来所需的外力便会很大,便能够克服较大的阻力维持原有运动。
雷涛还表示,如今大语言模型在多模态在空间认知上取得了非常大的一个成果,其可以基于语言模型抽象出每个人在会议中的核心观点,还可以基于内容进行选择,把劳动力从重复性的工作中解放出来,实现场景式理解视频内容。