欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻
# 2024.4.7OpenSource Daily
首个开源世界模型!百万级上下文,长视频理解吊打 GPT-4
来自 UC berkeley 的研究人员开源了首个世界模型,多模态性能优秀,长视频理解吊打 GPT-4,同时将上下文长度增加到百万级别。
上图展示了 LWM 的多模态训练。第一阶段是上下文扩展,重点是使用 Books3 数据集扩展上下文大小,从 32K 增长到 1M。第二阶段,视觉语言培训,重点是对不同长度的视觉和视频内容进行培训。
饼图详细说明了训练数据的分布情况,包括 495B 的文本 - 视频数据,以及 33B 的文本数据。
FFmpeg 7.0 “Dijkstra” 发布
FFmpeg 7.0 “Dijkstra” 现已发布。此版本以荷兰计算机科学家 Edsger W. Dijkstra 的名字命名,一些值得注意的变化包括原生 VVC 解码器(目前处于实验阶段)、IAMF 支持以及多线程 ffmpegCLI 工具。
该版本并不向后兼容,删除了 6.0 之前废弃的 API。对大多数 library callers 来说,最大的变化是删除了旧的 bitmask-based channel layout API,取而代之的是允许自定义通道排序或 Ambisonics 等功能的 AVChannelLayout API。某些过时的 ffmpegCLI 选项也已被移除,现在需要使用兼容 C11 的编译器来构建代码。
Redict 首个稳定版 7.3.0 发布,基于 Redis 7.2.4 的社区分支
Redict 首个稳定版 7.3.0 已发布。此版本 fork 自 Redis 7.2.4,采用 LGPL 开源协议 —— 团队称这是为了确保云厂商可以继续向其客户提供 Redict,而无需遵守繁琐的合规条款。
Redict 团队还表示他们的重心是保证项目稳定性和长期可维护,这区别于 Valkey。Valkey 得到了商业公司的支持,因此能投入更多资源开发更激进的创新。而 Redict 对创新更为保守,追求长期稳定性而不是长期增长,这对现有用户更有价值。
微软完成 Azure RTOS 的开源迁移:更名为 Eclipse ThreadX、采用 MIT 开源协议
2023 年 11 月,微软宣布 Azure RTOS 将在 Eclipse 基金会的管理下过渡到开源模式,Eclipse 基金会是托管开源物联网项目的公认领导者。
近日,微软宣布自 2023 年 11 月启动过渡计划以来,不断推进 Azure RTOS 的开源工作,对 Eclipse 基金会的贡献近期终于完成,并发布了 Eclipse ThreadX 6.4.1 版本。最新发布的 Eclipse ThreadX 6.4.1 版本(前身 Azure RTOS)和中间件组件采用 MIT 许可,其功能等同于 Azure RTOS 6.4,而后者正是已经部署在全球数十亿嵌入式系统上的优秀产品。
Eclipse ThreadX 还包括一些中间件组件,如 FileX、GUIX、NetX Duo 和 USBX,这些组件也可以独立于 RTOS 使用。这意味着开发者可以将这些组件与其他实时操作系统一起使用,甚至可以在没有 RTOS 的情况下使用。
今日观察
社交观察
「22 岁的火狐,市占率被 3 岁的自己超了」
从螺旋起飞到求给机会,从 30% 到 3% 不到,火狐到底发生啥了?
从 2010 年开始,火狐一直在丢失市场,市占率每 4 年跌 10%,前几年辛苦攒的用户全跑了。在 2017 年,Mozilla 的 CEO 也承认说:Firefox 没有跟上市场发展,没能及时满足用户需求,很多 Firefox 铁粉都成了 Chrome 用户。
- 差评
「你混淆过的 JS 代码将和 “开源代码” 没什么区别」
- 微博 程序员那些破事
「 这篇生成式 AI 的文章,让我想起若干年前与网吧老板的闲聊」
华尔街这篇生成式 AI 的文章,让我想起若干年前与网吧老板的闲聊,我问他一年能挣多少,他说挣的钱都用来换电脑了,向我倒苦水。那时候正是网吧最火爆的时候也是电脑硬件飞速发展的时候。如果不及时更新硬件,就玩不了新游戏,玩不了新游戏就没人来了,于是很大一部分利润不得不投入到电脑的升级换代上。
现在生成式 AI 的情况更糟,因为它还不能赚钱,却要求投资者不断增大投入,而未来该怎么变现的影子都还看不到。
嗯,但无论如何这种狂热利好硬件公司,做 GPU 的可是实实在在的挣到钱了,只要 AI 热潮再维持两三年,那股价再涨三五倍可能也没啥压力。
- 微博 三思逍遥
「弱智吧成最佳中文 AI 训练数据」
对于这类现象,研究人员在分析中也给出简单猜测:可能是弱智吧问题增强了 AI 的逻辑推理能力,从而使指令遵循任务受益。
当然弱智吧并不是这项研究的全部,它的真正贡献在于为中文大模型开发提供了一个高质量的指令微调数据集 COIG-CQIA。
- 微博 观察者网
媒体观察
「人工智能未来之路:开源与闭源之争 社区创办者力挺开源之路」
目前,“开源” 模式获得不少知名公司和机构的支持,例如元宇宙旗下的利亚马(LLaMA)、斯坦福大学旗下阿尔帕卡(Alpaca)等都已经公开了 “算法”。
在很多专家看来,开源技术可以加速人工智能创新。在利亚马开源的说明中,他们还认为,开源可以让 “开发者和研发者对人工智能进行压力测试,作为一个社区,快速识别和解决问题。”
- 央视新闻
「AI 人才争夺战,马斯克直呼 “史上最疯狂” 」
近日,特斯拉 CEO 马斯克在社交媒体平台上发帖称:“OpenAI 一直在高薪挖特斯拉工程师,不幸的是,经常有成功挖人的例子。”
上个月,机器学习科学家 Ethan Knight 成为第三位投身 xAI 的特斯拉工程师。马斯克透露,在 Knight 即将转向 Open AI 之际,自己出手了,为 xAI 截胡了 Ethan Knight。
“AI 人才争夺战是我见过的最疯狂人才争夺战。” 马斯克如此感叹!
- 证券时报
「为大模型定制一颗芯片?」
想要训练一个大模型,代表算力的芯片就是最关键的一环,也是成本最高的一环。
这也导致了一个问题,如果 AI 照着现在这幅样子发展下去,那么成本就会越来越高,高到绝大部分公司都难以承受的地步,根据外媒估计,如今正在开发的大模型,平均每个需要花费约 10 亿美元,而下一代大模型呢,平均每个需要花费 100 亿美元来训练,这个天文数字,在硅谷买下几十家有潜力的初创公司都还有得找。
在美国硅谷,迈克 - 冈特(Mike Gunter)和雷纳 - 波普(Reiner Pope)这两位从谷歌出走的工程师,他们成立了一家名为 MatX 的公司,而这家公司的目标,就是设计专门用于 LLM(大型语言模型)的,更便宜、更快速、更适合人工智能的芯片。
- 半导体行业观察
「华为 “天才少年” 4 万字演讲:现在的 AI 技术要么无趣,要么无用」
李博杰在这篇文章中表示,AI 的发展目前有两个方向,一个是有趣的 AI,也就是更像人的 AI;另外一个方向就是更有用的 AI,也就是更像工具的 AI。但目前的 AI 技术,要么是只有趣但没用,要么是只有用但是不像人,“不好玩”。
李博杰指出,通用人工智能(AGI)的目标是,兼具慢思考和类人属性的 AI Agent,然而当前 AI Agent 和人类梦想之间存在巨大的差距。
李博杰坦言,Video Diffusion 是一个更为终极的技术路线。尽管大模型的成本一定会快速降低,但他不建议贸然自己去做基础模型。
“如果没有拳打 OpenAI、脚踢 Anthropic 的实力,在效果上比不过最好的闭源模型,成本上也比不上开源模型。” 李博杰表示。
- 钛媒体
「10 万美元训出 Llama-2 级大模型!全华人打造新型 MoE」
“只需” 10 万美元,训练 Llama-2 级别的大模型。尺寸更小但性能不减的 MoE 模型来了:它叫 JetMoE,来自 MIT、普林斯顿等研究机构。性能妥妥超过同等规模的 Llama-2。
JetMoE 发布即完全开源,且学术界友好:仅使用公开数据集和开源代码,用消费级 GPU 就能进行微调。
传送门:
https://github.com/myshell-ai/JetMoE
- 量子位
今日推荐开源项目
toeverything/AFFiNE
https://github.com/toeverything/AFFiNE
AFFiNE 是开源协作知识库软件,注重隐私保护,面向专业人士打造。
特性
推荐理由
AFFiNE 是一个注重隐私保护的开源个人笔记软件,提供了一个简洁直观的用户界面和 Markdown 支持,方便用户进行内容创作和格式化。
作为一个离线优先的解决方案,AFFiNE 让用户能够完全控制自己的数据,并在离线状态下工作,数据在重新联网时可以无冲突合并。AFFiNE 的设计理念和对隐私的重视,使其成为 Notion 等在线笔记应用的优秀替代品。
每日一博
前端架构设计的一点考究
本文总结了作者在日常 / 大促业务的 “敏捷” 开发过程中产生的疑惑,并尝试做出思考得到一些解决思路和方案。在前端开发和实践过程中,梳理了一些简单设计方案可以缓解当时 “头疼” 的几个敏捷迭代问题,并实践在项目迭代中。
https://my.oschina.net/u/4662964/blog/11051025
事件点评
首例,美国法官裁定 AI 增强视频不足以作为法庭证据
美国全国广播公司 (NBC) 报道称,在美国华盛顿州的一项三重谋杀案判决中,法官 Leroy McCullogh 判定使用 AI 增强过后的视频不足以作为证据呈现。这是行业中的首例此类裁决。
McCullogh 法官认为此类软件依赖于 "不透明的方法来表现 AI 模型认为应该显示的内容"。
裁决书写道:“本庭认为,采纳这一 AI 增强证据会导致问题混淆,混淆目击证人的证词,并可能导致一场耗时的审判中的审判,涉及 AI 模型所使用的不可同行评议的程序。”
点评
此裁决标志着 AI 技术在法庭证据领域的应用受到了限制,同时也引发了关于技术在法律程序中角色的重要讨论。此案例的影响深远,它不仅影响了当前的法庭实践,也为未来的法律和技术发展提供了重要的参考。对于法律界和科技界来说,这起案件是对如何在法律框架内合理应用新技术的考验,同时也突显了技术在司法领域应用的复杂性和潜在风险。
此外,这一事件还可能对公众对 AI 技术的看法产生影响,尤其是在法律和证据采集领域的应用。公众可能会更加关注 AI 技术的透明度和公正性,以及在法律程序中使用 AI 技术的潜在偏见和误导性。
总体而言,这一事件不仅是一个法律案例,也是对 AI 技术在法律和司法领域应用的深刻反思,其影响将波及到法律实践、技术发展和公众意识等多个方面。
德国也要 “自主可控”,州政府将 3 万台 PC 从 Windows 迁移到 Linux
在试点成功之后,德国北部州 Schleswig-Holstein(石勒苏益格 - 荷尔斯泰因)决定将政府机构使用的 3 万台 PC 从 Microsoft Windows 和 Microsoft Office 迁移到 Linux 和 LibreOffice。
不过该政府做出这一决定并不是因为 Linux 和 LibreOffice 的技术优势,而是因为看重 “数字主权”。
州政府总理表示该州成为德国第一个引入数字主权 IT 工作场所的州。数字主权 (Digitally Aovereign) 是指相对于封闭的私有软件,公共管理部门对开源软件构成的 IT 解决方案有更多的控制权。政府部门可以有更多的选择,可以资助当地的程序员改进开源软件,可以根据需要进行修改以部署在自己的基础设施中。
点评
德国石勒苏益格 - 荷尔斯泰因州的决策体现了对数字自主性的重视,同时也是对全球软件供应链依赖性的一次重要反思。虽然开源软件提供了更大的灵活性和控制权,但历史案例表明,此类迁移并非没有挑战。
长远来看,这一举措可能会对开源软件的发展和政府 IT 策略产生深远影响。
超 4000 应用加入鸿蒙生态
华为官宣目前已有超 4000 个应用加入鸿蒙生态,鸿蒙生态进入第二阶段。值得注意的是,从今年 1 月 18 日华为宣布首批 200 多家应用厂商正在加速开发鸿蒙原生应用,到 3 月底超 4000 个应用,短短两个月时间增长幅度高达 20 倍。
点评
这一成就对于华为来说,不仅显示了其在推动鸿蒙生态系统方面的迅速进展,也反映了鸿蒙在业界的影响力和吸引力。对于华为而言,鸿蒙生态的快速扩张是其技术战略的重要里程碑,有助于提升其在操作系统领域的竞争力。
对于开发者来说,鸿蒙生态的快速增长意味着更多的机会和挑战。开发者可以利用鸿蒙平台开发出更多创新的应用,满足用户需求,同时也要面对更加激烈的竞争。对于整个操作系统市场来说,鸿蒙生态的快速发展可能改变现有的市场格局。
开源之声
媒体观点
中国围棋协会主席:人工智能很强大 但无法取代 “手谈”
在常昊看来,人工智能的确给如今的棋手带来了颠覆性的体验:“从 AlphaGo 击败李世石和柯洁开始,人工智能的围棋就已经进入了大家的视线。尤其是 2018 年,深度学习的技术开源之后,利用人工智能训练已经是每一个职业棋手必备的。这个过程颠覆了很多大家对围棋的认识。尤其是我,我小的时候学习的下法,很多都已经被人工智能给颠覆了。”
在承认人工智能 “威力” 的同时,常昊并不认为科技会让围棋失去魅力。“我觉得围棋的本质并没有变化。其实我们人类一直也在探索围棋的奥妙,围棋太难了,可以说,即便我们的高手也只是懂一点点。所以我也很希望人工智能这样一种科技的力量,可以帮助我们进一步探索围棋的奥妙,把围棋更深层的魅力展现出来。”
- 羊城晚报
搞 AI 的是真没钱了
尽管现在 AI PC、AI 手机是噱头成分居多,真正在 C 端有决定意义的价值点较少。但这趟列车已经绑定了太多的人:高通、英特尔、三星、联想…… 以及一系列基础模型厂商、模型中间件厂商。某种意义上,这是 “元宇宙 Plus” 版的概念列车,必须找到终点,也必须驶到终点。与当年元宇宙的情况不同的是,大模型当下的技术发展曲线,仍在陡峭上升中 ——
至少在 GPT-5 发布前,所有的商业故事,都会如约讲下去。
- 虎嗅
揭秘 AI 幻觉:GPT-4V 存在视觉编码漏洞,清华联合 NUS 提出 LLaVA-UHD
清华大学、新加坡国立大学和中国科学院大学的发布了一篇题为《LLaVA-UHD: an LMM Perceiving Any Aspect Ratio and High-Resolution Images》的论文。该工作对当前最强的商业大模型 GPT-4V 和最受欢迎的开源模型 LLaVA-1.5 进行了实验,揭示了目前多模态大模型中的视觉编码漏洞。。
LLaVA-UHD 将图像分辨率限制在最大 672×1008。但是在未来,考虑到其具有潜力的效率和可扩展性,将探索更高分辨率的图像以及更具挑战性的任务,如小目标检测和分割。此外,目前图像片段是独立编码的,只在 LLMs 中进行交互。计划通过改进的视觉编码策略,在图像片段之间建立高效的连接,实现细粒度全局信息交互。
- 机器之心
“弱智贴吧” 的数据,居然是最强中文语料库
中国科学院、北大、中国科技大学、滑铁卢大学、01.ai 等 10 家机构联合推出了,专用于中文的高质量指令调优数据集 ——COIG-CQIA。
COIG-CQIA 几乎抓取了中文互联网的论坛、网站、百度贴吧、问答社区等高质量数据集。用 COIG-CQIA 对 Yi-6B、Yi-34B 进行指令调优,再用 GPT4 在 BELLE-EVAL 上评估在各种数据集上训练的大模型性能。
有趣的一幕出现了,“弱智贴吧” 的数据质量,居然大幅度超过知乎、豆瓣、是否等知名知识社区,还真是大智若愚啊~
- AIGC 开放社区
用户观点
德国政府 “又” 从 Windows 迁移到 Linux
JetBrains 全家桶 2024 首个大版本更新 (2024.1)
- 观点 1:建议安装双系统
- 观点 2:建议别建议
- 观点 3:还要再迁回去
- 观点 4:Linux 为基础的系统和服务必定是未来趋势
- 观点 5:完全正确的选择。
超 4000 应用加入鸿蒙生态
- 观点 1:Docker 插件好像有点问题,Docker 部署不能用。提示:Cannot run program "docker.exe"
- 观点 2:数据库的导出指定了 mysqldump 的路径,下次导出还得继续指定路径
- 观点 3:更新了,挺不错,没发现问题
- 观点 1:我就问一条:这么多 app 里有微信吗?
- 观点 2:没有微信天也塌不了,正好不用加入工作群了。
程序员梗图
END
References
https://mp.weixin.qq.com/s/HtTRrIVYqmdUb_h6P9lFtA
https://www.oschina.net/news/286466/ffmpeg-7-0-released
https://redict.io/posts/2024-04-03-redict-7.3.0-released/
https://techcommunity.microsoft.com/t5/internet-of-things-blog/azure-rtos-transition-to-open-source-is-now-complete/ba-p/4105027
https://ishare.ifeng.com/c/s/8YWCNTbDlCO
https://weibo.com/2153528647/O8AtGzp71
https://weibo.com/1781866371/O7IZU3TjV
https://weibo.com/1887344341/O8jlHxlv7
https://content-static.cctvnews.cctv.com/snow-book/index.html?item_id=1466476220508501922
https://ishare.ifeng.com/c/s/8YZ94Q8yxXv
https://mp.weixin.qq.com/s/j3UX-XmXzopxQ_nxw0Lzgg
https://mp.weixin.qq.com/s/UdKnL3PXLCQi_uW1wDVMyw
https://k.sina.com.cn/article_6105753431_16bee6757019015ptc.html
https://github.com/toeverything/AFFiNE
https://my.oschina.net/u/4662964/blog/11051025
https://www.nbcnews.com/news/us-news/washington-state-judge-blocks-use-ai-enhanced-video-evidence-rcna141932
https://www.oschina.net/news/286428/german-state-ditches-microsoft-for-linux-and-libreoffice
https://www.oschina.net/news/286498
https://news.cctv.com/2024/04/06/ARTINGtIZfff3vzB8p9rC0mY240406.shtml
https://finance.sina.com.cn/wm/2024-04-06/doc-inaqwuqr8422545.shtml
https://finance.sina.cn/tech/2024-04-07/detail-inaqytfu6397434.d.html?fromtech=1
https://new.qq.com/rain/a/20240407A00P1G00
https://mp.weixin.qq.com/s/gXqy15CRaDwGx6KSVu0Lww
https://www.oschina.net/news/286486
最后,欢迎扫码下载「开源中国 APP」
阅读海量技术报告、程序员极客分享