今天分享的是:贝壳(贾琳):当我们用AI写了100万行代码
报告共计:24页
该文档聚焦贝壳在AI编程领域的探索与实践。AI编程旨在自动化编程过程,虽面临程序空间搜索和用户意图表达两大挑战,但谷歌、微软、华为等公司的实验和实践表明,大模型能提升编程效率。贝壳研发的AI研发助手CodeLink,设计理念围绕AutoComplete代码补全助手、CodeChat结对编程专家、WorkBench私域工作台展开,在不改变原有编码方式的基础上提供全新编程体验,具备代码续写、函数生成、技术方案问答等多种功能。在落地实践方面,贝壳采用分层抽样分组进行对照试验,自建评测框架评估模型,且选择自研模型,其优势在于可针对特定任务和场景优化,保障数据安全隐私,降低成本并便于持续改进。通过该框架对CodeLlama - 7B模型进行增量预训练和指令微调,在Javascript上取得了较好效果,生产环境采纳率达一定比例。从实际应用来看,CodeChat与AutoComplete协同解决写代码问题,WorkBench解决接口文档编写和联调部署测试难题,实现智能化人机协同。目前,CodeLink取得了一定成果,覆盖了一定比例的研发工作,提升了代码采纳率和AI代码占比。未来,CodeLink计划向全面自动化人机协同迈进,将大模型能力植入更多研发流程,变革开发和协同方式,打造插件生态,培养更多全栈AI工程师,推动AI在编程领域的深入应用。
以下为报告节选内容