10月14日·Karpathy开源“nanochat”,低成本自建ChatGPT

10月14日·周二  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

Karpathy开源“nanochat”,低成本自建ChatGPT

AI领域大神Andrej Karpathy发布了名为nanochat的开源项目,该项目仅用100美元成本和8000行代码,就能让开发者从零开始自建类似ChatGPT的模型。nanochat覆盖了LLM的训练和推理全流程,依赖极少且结构清晰。用户只需启动云GPU机器并运行脚本,4小时后即可在Web界面与自己的LLM聊天。Karpathy还表示,该项目未来有望成为研究平台或标准基准。来源:微信公众号【机器之心】

10月14日·Karpathy开源“nanochat”,低成本自建ChatGPT

RAE登场,或成DiT训练新基石

纽约大学助理教授谢赛宁团队提出了RAE表征自编码器),旨在替代存在10多年的VAE(变分自编码器)。RAE结合预训练的表征编码器和训练好的解码器,解决了VAE计算量大、表征能力弱等问题。基于RAE的DiT^DH变体在ImageNet数据集上取得了优异的图像生成效果,展现出明显优势,有望成为DiT训练的新默认方案。来源:微信公众号【机器之心

10月14日·Karpathy开源“nanochat”,低成本自建ChatGPT

蚂蚁发布万亿参数思考模型Ring-1T

蚂蚁集团开源了万亿参数思考模型Ring-1T,这是全球首个开源的万亿参数思考模型。该模型在数学、编程、逻辑推理等多维基准上表现优异,达到开源SOTA水平,部分测试接近闭源旗舰GPT-5表现。在IMO 2025测试中,Ring-1T解出4题,达到银牌水平,展现了强大的复杂推理能力。来源:微信公众号【量子位10月14日·Karpathy开源“nanochat”,低成本自建ChatGPT

国产免费命令行iFlow CLI发布

阿里心流研究团队发布了终端AI智能体iFlow CLI,号称Claude Code最强平替。该工具专为国内开发者设计,永久免费且不限流。iFlow CLI在多项基准测试中表现优于Claude Code等工具,支持自然语言执行任务,流程全面自动化,还提供本土化体验和开发者论坛等特色功能。来源:微信公众号【量子位

10月14日·Karpathy开源“nanochat”,低成本自建ChatGPT

MIT新框架SEAL实现AI自主更新

MIT提出SEAL(Self-Adapting LLMs)框架,让模型生成微调数据和自我更新指令,实现权重自主升级,无需人工参与梯度更新。SEAL通过内外两层嵌套学习机制,赋予大模型自我驱动的更新能力。在知识注入和小样本学习实验中,SEAL均展现出较强的知识整合和任务适应能力,推动了AI的自主学习发展。来源:微信公众号【量子位】10月14日·Karpathy开源“nanochat”,低成本自建ChatGPT

© 版权声明

相关文章

暂无评论

暂无评论...