9月2日·OpenAI在印度建1GW数据中心,奥特曼亲自推动全球算力布局

9月2日·周二  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

OpenAI在印度建1GW数据中心,奥特曼亲自推动全球算力布局

OpenAI计划在印度建设至少1GW规模的数据中心,这是其「星际之门」计划首次大规模进入亚洲。该计划由OpenAI、软银、甲骨文及阿布扎比MGX基金共同投资,计划四年内投入5000亿美元建设超级数据中心集群。目前,OpenAI在美国德州的首个园区已开建10座数据中心建筑,建成后可提供约1.2GW的负载能力。除了美国,OpenAI还在中东、欧洲等地布局,如与阿联酋企业合作建设5GW的AI园区项目,在挪威启动「星际之门·挪威」项目。此次选择印度,一方面是因为印度庞大的用户增长潜力,其已成为OpenAI第二大市场,且OpenAI还为印度推出了定价便宜的ChatGPT Go服务;另一方面,印度多语言应用场景对AI模型的本地化提出了更高要求,OpenAI在GPT-5中提升了对多种印度本地语言的理解和支持,未来还计划在印度投入更多资源。奥特曼虽已淡出OpenAI日常管理,但仍专注于筹集资金建设超级计算项目等方向,此次印度数据中心建设是其全球化算力野心的关键一步。来源:微信公众号【新智元】

9月2日·OpenAI在印度建1GW数据中心,奥特曼亲自推动全球算力布局

特斯拉发布「秘密宏图IV」,80%价值将由人形机器人Optimus贡献

马斯克在X上发布了特斯拉秘密宏图IV」,目标是实现可持续富足的世界,核心是扩展FSD和擎天柱。马斯克表示,未来特斯拉80%的价值将由人形机器人Optimus贡献。特斯拉自创立之初就致力于实现真正的可持续发展,宏图计划从最初的交通电气化,到整合清洁能源生成与存储,再到加速可持续能源经济,如今进入第四篇章,将AI作为核心引擎,深度融入现实世界。Optimus的使命是将宝贵的时间归还给人类,让人类去做自己热爱之事。特斯拉正在打造将人工智能带入物理世界的产品与服务,人形机器人Optimus有望成为下一个万亿美元产业。马斯克还提到,未来世界上可能会有300-500亿人形机器人,远超人类数量,特斯拉的汽车也只是机器人生态的一个分支——轮式机器人,FSD作为机器人的“大脑”,可以移植到Optimus上,解锁更多应用场景,甚至植入Neuralink患者最终可以控制Optimus,并通过意念让机器人执行任务。来源:微信公众号【新智元

9月2日·OpenAI在印度建1GW数据中心,奥特曼亲自推动全球算力布局

美团开源LongCat-Flash模型,速度快成本低

美团开源的LongCat-Flash模型在HuggingFace上引起关注,其在H800显卡上推理速度超过每秒100个token,成本仅为每百万输出token 0.7美元。该模型是一个混合专家模型,总参数量为5600亿,可根据上下文需求动态激活不同数量的参数,训练数据量超过20万亿token,训练时间不到30天,且训练过程基本实现“无人干预”自动完成。LongCat-Flash采用新颖的MoE架构,包含零计算专家和快捷连接MoE机制,通过动态计算资源分配和通信 – 计算重叠窗口的设计,实现资源优化配置和性能提升。此外,美团还提出了一套高效的模型扩展策略和多阶段训练方法,进一步改善模型性能。在实际应用中,LongCat-Flash表现出色,生成速度远超人眼阅读速度,联网搜索也能快速给出答案,且附带引用来源,保障信息可信度。美团开源该模型顺应了大模型从性能竞赛向实用导向转变的趋势,为预算有限的开发者和企业提供了一个有价值的参考。来源:微信公众号【机器之心

9月2日·OpenAI在印度建1GW数据中心,奥特曼亲自推动全球算力布局

谷歌Gemini解锁“详解网页”新技能,URL Context功能上线

谷歌Gemini API全面上线的URL Context功能,使Gemini模型能够访问并处理来自URL的内容,包括网页、PDF和图像。与以往AI通过通用浏览工具或搜索引擎插件仅读取网页摘要或部分文本不同,URL Context可深度、完整地解析文档结构、内容和数据,支持深度解析PDF、多模态理解以及处理多种网页文件格式。开发者只需几行代码就能实现精准效果,无需搭建和维护复杂的RAG管道。URL Context采用两步检索流程,先从内部索引缓存获取内容,若不在缓存中则进行实时抓取。不过,它无法翻越“付费墙”,对YouTube视频、Google Docs等有专门API处理的内容不会涉足,且单次请求最多处理20个URL,单个URL内容上限为34MB。其计费方式按处理内容Token数量计费,引导开发者进行更高效的应用设计。URL Context的出现反映了基础模型将越来越多的“外部能力”内置化的行业趋势。来源:微信公众号【机器之心

9月2日·OpenAI在印度建1GW数据中心,奥特曼亲自推动全球算力布局

字节Seed新模型让长视频生成成本大幅降低

字节Seed与斯坦福等机构研究人员推出的新模型,通过Mixture of Contexts(MoC)稀疏注意力机制,将长视频生成的计算量降低85%,同时保持人物和场景的连贯性。该机制将长视频生成重构为上下文检索任务,先把跨模态序列切成语义同质的内容块,然后让每个查询token只与最相关的少数块建立注意力连接,避免无谓的计算浪费。在工程实现方面,MoC可充分并行,在GPU上实现对数千万token的线性伸缩且访存连续。使用MoC机制生成一分钟的480P视频,仅需消耗2.32×10¹²FLOPs的计算量,而基线模型需要1.66×10¹³FLOPs。在多镜头64秒的480P视频中,MoC节省约86%的计算量;单镜头8秒的320×192短片测试里,MoC计算量减少约78%。此外,MoC在主题一致性、背景一致性、动作连贯性、图像质量等性能指标上均优于基线模型。来源:微信公众号【量子位】

9月2日·OpenAI在印度建1GW数据中心,奥特曼亲自推动全球算力布局
© 版权声明

相关文章

暂无评论

暂无评论...