您现在所在的位置:首页>>新闻>>院内新闻
计算中心在2023年北京市人工智能行业大模型创新应用大赛获胜————北科政务服务大语言模型引领政务智能化新篇章
发布时间:2024-04-29 16:21

《北京市人工智能大模型行业应用分析报告》附录

初赛路演现场

复赛现场

4月25日-29日,2024中关村论坛年会在北京召开,北京市行业大模型创新应用大赛奖项获奖名单正式公布并颁奖,北京市计算中心有限公司凭借自主研发的“北科政务服务大语言模型”在“政务领域”获胜。

此次大赛于2023年9月启动,由北京市科学技术委员会、中关村科技园区管理委员会等相关部门主办,设置政务、金融、产业升级、医疗、文化教育、智慧城市6个赛道,从100余家参赛单位中,共征集应用案例180余项,联合行业用户凝练15个核心业务场景作为考题,开放高质量行业数据上万条供参赛企业开展大模型调优,以此启发一批行业用户拥抱大模型技术,发现一批有潜力的技术企业,推动一批供需之间的交流合作。整个赛程分为两轮,初赛采用案例答辩的形式,复赛由市科委和相关单位出题,参赛单位经过2到3周时间研发,共同参与测试并评价模型效果。计算中心作为政务领域优胜企业,参赛成果和创新亮点被编入《北京市人工智能大模型行业应用分析报告》。

“北科政务服务大语言模型”是北京市计算中心响应北京市打造大模型应用标杆项目的成果之一,其基于大语言模型和政务知识库构建多项政务智能服务集合,具备自动问答、政策解读、知识查询、报告编写、内控管理、员工培训等功能,能够为社会公众和工作人员提供精准服务和主动服务,已在移动端、一体机、网页端、大屏端等多个平台得到应用。

在技术实现方面,该模型通过分段和打标,构建了可更新可维护的知识库,并结合了NLP(自然语言处理)、LLM(大型语言模型)和Langchain技术,实现了政策分析问答和意图识别。此外,模型还通过全量参数调节的Pre-train、监督微调(SFT)和语义向量模型(BGE-large-zh-V1.5)的重训练,进一步提升了性能。

“北科政务服务大语言模型”的创新亮点在于改进了基于多文档摘编的政务长文本处理技术、提出了大模型推训并行框架的重编译和适配方法,并实现了基于分类标签、模板匹配、SQL代码生成智能问答技术的集成创新等。同时,模型经过信创适配,实现了全国产化运行环境部署和应用,操作系统、处理器、高性能计算加速卡、服务器等均为国产,确保政务应用的安全性和可控性。《北京市人工智能大模型行业应用分析报告》介绍该创新点如下:“从部署上, 参赛企业在微调大模型后采用一体机的形式将大模型应用进行私有化部署,为数据敏感的政务场景提供解决方案”。此外,计算中心的专业文本数据集构建技术、文本向量化技术、本地知识库的构建技术,以及通过增强搜索提升模型对专业知识的理解和生成能力也通过大赛得到了进一步的锤炼。

计算中心作为科研单位整体转制形成的国家高新技术企业、中关村高新技术企业、北京市“专精特新”中小企业,致力于智慧化数字技术产品与服务,在智慧政务、智慧城市、智慧健康、智慧文博等细分领域形成了人大政协建议提案一体化服务平台、行业指挥调度平台、食品供应链风险监控预警智能系统、AI+智慧健康计算平台、一体化数字展厅在线制作平台等特色产品,通过人工智能技术长期为政府、医院、企业、高校和科研院所等提供智慧化服务,并在政务文本分析、计算机视觉等领域形成了具有竞争力的核心技术。此次获奖,是对我单位在人工智能领域所做工作的肯定,标志着计算中心在人工智能领域的技术实力和创新能力进一步得到了业界认可。后续,计算中心将继续积极推动大模型技术的发展和落地应用,为社会创造更多的价值。

(北京市计算中心有限公司)