每一次关键技术取得通用化的突破,都会深刻改变生产方式,并明显提升生产力水平,而“大模型”成为了打通人工智能技术通用性“任督二脉”的关键。智慧眼,作为全球领先的AI企业,最近推出了其创新研发的通用大模型砭石。
在1.0时代,感知智能中以计算机视觉为代表,即基于深度学习算法,赋能计算机理解数字图像和视频,智慧眼正是在这样一个时间段构建了机器视觉大模型,并在IDC的中国人工智能之计算机视觉应用市场占有率排名中进入前七,荣获中国智能科学技术最高奖吴文俊人工智能科学技术进步奖。
2.0阶段,认知智能将从认知心理学、脑科学及人类社会历史中汲取灵感,并结合跨领域知识图谱、自然语言处理、因果推理等技术,建立稳定获取和表达知识的有效机制,智慧眼发布了人工智能中台和大数据中台产品,实现了从感知智能到认知智能的跨越。
到了3.0时代,AI+X成为前沿方向,需要采用海量的高质量通用数据训练一个基础的底座,再针对不一样的场景,利用少量的专业数据来进行微调,实现低成本的AI场景落地。智慧眼研发了通用大模型砭石,该模型基于严格审核过滤的海量多模态数据训练,通过“预训练+精调”模式带来了新的标准化AI研发范式,实现AI模型在更统一、简单的方式下规模化生产,支持多种任务执行。
大模型生成代码,砭石通过对开源代码数据集进行多次清洗,得到高质量的代码数据集,随后通过预训练和CoT训练等方式,使得大模型具有强大的代码生成和推理能力,极大地提高了软件开发的效率和质量。
大模型写作能力,砭石大模型在更多参数和更复杂的结构基础上,使用海量的通用文本型数据来进行预训练,学习了大量通用知识和逻辑,表现出了强大涌现能力和学习能力,生成了富有韵律、节奏和情感表达的诗歌。
砭石大模型基于自然对话方式理解和执行任务,提供多种能力包含文本、图像、视频、音频输入,生成式输出文本信息,具备闲聊和知识问答能力,可以为情感陪伴、政策问答、大数据分析等场景赋能。
大模型的创新,远不止于模型本身的革新,其更深层次地依赖于AI领域中的各项核心技术突破。在这方面,智慧眼企业具有显著的优势,其在知识图谱、智能大模型以及隐私计算等关键技术上,都拥有自主研发的核心算法和独立的知识产权,这为通用大模型创新提供了坚实的基础。包括:
在知识图谱方面:公司突破保护隐私的分布式知识迁移和联邦图谱推理,接入差异化的大规模行业数据,构建世界一流的高可信高质量的海量数据知识图谱,为知识图谱缓解大模型幻觉奠定基础。
在智能大模型方面:公司突破了隐私计算条件下的大模型联邦训练、基于知识图谱的大模型知识增强等核心技术,明显提升大模型在专业领域的信息生成准确度。
在隐私计算方面:突破了保护隐私的分布式知识迁移和联邦图谱推理技术,实现对高价值用户的敏感隐私数据的脱敏,实际做到数据的“可用不可见”安全应用,实现分布式知识的融合和基于分布式数据的大模型训练,支撑了用户数据价值的释放。
智慧眼砭石大模型的核心定位是为各行各业注入新的活力,采用完全的分层解耦设计,包括两层,首层为砭石通用大模型层,最重要的包含机器视觉、自然语言理解、多模态和认知4大基础模型,为各种应用场景提供相关的AI基础能力;第二层为行业大模型,基于通用大模型层,能够整合行业用户的自有数据,训练客户的自有专有大模型。通过这种分层次的设计,智慧眼砭石大模型不仅提供了广泛的通用能力,还能根据各行业的详细情况,实现高度个性化的赋能。
机器视觉大模型,“为机器植入眼睛与大脑”。此模型通过在大规模图像数据上进行训练,能轻松实现各种视觉任务,可以有效的进行图像的分割和识别、分析视频等。
自然语言理解大模型,“让机器理解人类语言”。此模型基于数T Token的高质量语料训练而成,可以在一定程度上完成负责的自然语言处理任务。
多模态大模型,“让机器拥有丰富感官”。此模型通过对文本、图片、视频和音频等不同储存信息载体的认知和理解,来模拟人与人之间的交互方式,为创新性应用提供了坚实的基础。
认知大模型,“让机器思考分析决策”。此模型能适应包括各类传感器等不一样感知数据源的输入,实现对环境的的理解与分析。
在行业大模型层面,砭石将涵盖诸如医保、金融、保险、政务、养老、教育多个专业领域,这些大模型的核心价值在于为不一样的行业的发展提供了强大的赋能。
总结来说,基础大模型致力于攻克技术难题,深入探索通用性与泛化性;而行业大模型则通过深度融合行业数据与知识特性,为特定行业量身定制坚实的基础。基础大模型为行业大模型的建设提供有力支撑,同时,行业大模型又能够结合实际应用场景与真实数据,为基础大模型的逐步优化提供宝贵的反馈与滋养。
大模型堪称AI领域的一座重要里程碑。展望未来,智慧眼将秉承持续创新的精神,引领AI技术发展浪潮,推动大模型技术如高山流水般汹涌澎湃,广泛覆盖医保、金融、保险、政务、养老、教育等各行各业,从而为社会持续健康发展注入全新的、高质量的生产力。