让模型主动理解多模态数据价值-恒生指数投资8 月 20 日,环球着名数据与AI公司 Databricks 正式对外颁布告示,公布公司正促进一轮领域超 10 亿美元的 K 轮融资,目前干系各方已缔结投资条件清单。此次融资对应的公司估值将打破 1000 亿美元(约合邦民币 7179.1 亿元)。正在环球未上市的首创企业中,公认估值超千亿美元的玩家包罗 SpaceX、OpenAI 以及字节跳动;另外,马斯克旗下的人工智能公司正在年头与社交媒体平台 X 实现重组后,其统一融资对应的估值也已打破千亿。而 Databricks 此次融资的实现,将使其得胜跻身千亿美元独角兽阵营,成为环球第五家估值超千亿的独角兽企业。
Databricks 创造于 2013 年,永远聚焦于打制数据与人工智能深度统一的联合平台,是 “湖仓一体” 数据库架构的开创者,而这一架构恰是 Data+AI 政策落地的症结技巧撑持。其数据智能平台构修于盛开的湖仓架构之上,为数据及处分管事供应了联合的技巧底座,并连结针对企业的特别特色优化的人工智能模子,造成了重大的技巧协力。
Databricks产物包罗三大模块,全方位餍足企业正在数据处置、AI操纵拓荒及数据拘束等众方面丰富需求:
·数据湖仓:涵盖 Delta Lake 等中央组件,完成高效的数据存储与拘束,援手大领域数据的及时处置与理会,为企业的数据流转供应坚实根柢;
·AI器械:旗下 MLflow 专心于呆板练习人命周期拘束,从模子的拓荒、摆设到跟踪,为企业供应便捷高效的全流程援手,助力企业轻松促进AI模子的落地操纵;
·数据器械:蕴涵了如 Unity Catalog 等产物,具备重大的数据处分和元数据办事,全方位确保数据的安详性、合规性,同时鼓吹数据的高效觉察与利用 ,让数据外现最大价格。
Databricks 洞察到开源大模子正走向商品化的趋向。而其自己重大的 AI 效力,为这一趋向注入了重大动力。正在模子陶冶加快方面,Databricks 的散布式估计架构不妨填塞诈欺大领域集群资源,明显缩短开源大模子的陶冶周期。正在模子摆设与拘束上,Databricks 供应的一站式处置计划,能助助企业轻松将开源大模子摆设到分歧的坐褥情况中,无论是云端仍旧当地办事器,都能确保模子宁静运转。同时,通过其直观的界面,企业能够及时监控模子的职能目标,如响适时间、确凿率等。一朝觉察模子正在现实操纵中显露偏向,可即刻正在 Databricks 平台进步行优化调节,确保模子正在各类营业场景下一连高效运转,加强了开源大模子行为商品的牢靠性与宁静性。
Databricks 以数据为基石,以人工智能为引擎,完成了从ETL到数据堆栈再到 AI 的扫数据链道。由数据智能引擎(Data Intelligence Engine)助助企业高效整合和处置大领域数据,将海量数据转化为 AI 模子可直接诈欺的优质 “燃料”,广大操纵于数据工程与 AI 模子陶冶的协同、数据科学与呆板练习的统一、AI 操纵的疾捷落地等场景。目前,超出 60% 的产业 500 强企业都正在借助 Databricks 的数据与 AI 统一平台,让数据更好地驱动 AI 改进,同时通过 AI 反哺数据价格的深度发掘。
拓数派行为浙江省准独角兽、将来独角兽企业,依赖“数据+模子”根柢AI的中央技巧上风与阿里云、DeepSeek等头部企业合伙入选“杭州根柢AI十八罗汉”。行为来自中邦的全自助可控的准独角兽,拓数派是“可托数据+AI模子”赛道的别的一个拓荒者,正在数据估计干系规模与Databricks正在技巧视野和贸易价格上有许众不约而合的行业趋向共鸣。
正在产物系统上,拓数派旗下大模子数据估计体例πDataCS(简称DataCS)改进性构修了平行的可托数据空间与估计空间,向上供应垂类模子全人命周期和智能体拓荒的器械链系统,向下完成对异构数据和算力的智能化调剂,有用破解数据孤岛和算力烟囱困难,助力企业加快数据与模子的统一,为私域大模子和智能体AI的落地供应重大撑持。
从数据底座架构来看,DataCS与Databricks高度好似。雷同Databricks的数据智能引擎,DataCS由四大估计引擎供应络续动力,离别是:援手古代BI理会的虚拟数仓引擎、专为模子语料库优化的向量估计引擎、模子连结私域数据的络续陶冶引擎,以及模子正在异构算力下的推理引擎,为BI/大数据理会、私域垂类模子的络续陶冶、垂类智能体的拓荒和打制等操纵场景供应撑持。个中, DataCS 虚拟数仓引擎 PieCloudDB 可无缝对接三方数据和数据理会引擎,以餍足湖仓一体、数据湖等场景需求,并原生援手数据因素流转,餍足私域客户对数据隐私和负责权的高哀求。而 Databricks 则以其 Databricks Lakehouse Platform 为中央,也统一数据堆栈与数据湖上风,供应数据处置、理会和呆板练习办事,涵盖了数据全链道拓荒。
DataCS独创的简墨主动元数据,供应了与Databricks的Unity Catalog雷同的联合元数据存储和拘束效力。该体例可无缝拜访可托数据空间,疾捷整合分歧数据体例的众样化数据(如布局化、时序、时空、外格、日记、图像等),联合数据目次以便数据觉察。另外,简墨主动元数据还内置数据触发机制,打通私域数据和公域模子的协同链道,让模子主动明了众模态数据价格,一连天生私域专属认知智能,加强智能体的理会和落地,助力企业和政府打制我方专属的智能体工厂。
拓数派深耕私域模子和智能体及其对应的数据估计底座,目前客户众为500强中央央邦企。
DataCS 已正在中邦船舶、中邦电子和中邦航信等邦度中央央企承受智能体和垂类模子中央底座。并正在众地政府落地异构算力和可托数据拘束平台,并得胜投产交通、社会处分等智能体。正在东吴证券、广发证券等金融机构行为垂类模子智能体拓荒平台,得胜投产了秀才 GPT 和数字人等智能体。
拓数派的全自助可控特色,使其正在邦内私域数据办事规模筑起坚实壁垒,宛如 Databricks 正在美邦商场依赖技巧改进和商场拓展占领紧要位置一律。二者虽处于分歧的商场情况,但都通过操纵中央技巧和办事才华,为各自区域的客户供应定制化、安详牢靠的数据处置计划,成为胀励私域数据办事发达的紧要气力。