研究者推出开源评估套件 EconEvals,试图用职业影响重构 AI 基准测试
Alexander Wan 等研究者发布开源评估套件 EconEvals,指出当前约 40% 的 AI 基准测试投入在数学和编程能力,但相关职业仅占美国岗位约 3.5%,因此该工具将评测扩展到更广泛工种并尝试预测就业扰动。这个方向把模型评估从刷题能力转向经济任务覆盖度,可能影响开发者如何选择基准、衡量模型实用性与劳动市场影响。
Alexander Wan 等研究者发布开源评估套件 EconEvals,指出当前约 40% 的 AI 基准测试投入在数学和编程能力,但相关职业仅占美国岗位约 3.5%,因此该工具将评测扩展到更广泛工种并尝试预测就业扰动。这个方向把模型评估从刷题能力转向经济任务覆盖度,可能影响开发者如何选择基准、衡量模型实用性与劳动市场影响。
当地时间6月24日晚,委内瑞拉接连发生强烈地震并致加拉加斯多栋建筑倒塌,当地侨团负责人接受采访时称据信已有约10名华人遇难,其中包括一名13岁女孩。若伤亡情况属实,这意味着此次海外地震灾害已直接波及当地华人社区,也会影响侨胞安全、救援与使领馆相关应对信息的判断。

Picsart 宣布 Happy Horse 1.1 已正式上线,面向创作者提供更多视觉叙事与视频生成方式;转帖内容显示阿里云对其发布进行背书。该更新属于 AI 创作工具的新版本落地,直接提升图像与视频生成场景的可用能力,也反映相关模型与云生态正在向创作者工具链渗透。
Happy Horse 1.1 已上线 fal 平台,支持文生视频、图生视频和参考图生视频,加入同步原生音频、多语言唇同步、最多 9 张参考图及 720p/1080p 输出。该接入把模型能力带入开发者分发平台,直接扩展了 AI 视频创作的可用场景与创作者工具选择。
Zerops 发布新版 quickstart,引导用户在约 5 分钟内部署一个真实应用,默认提供托管 PostgreSQL、公共访问 URL,并支持每次 Git 推送后自动部署,完成后还能加入实时展示墙。这个更新直接降低了从代码仓库到可上线环境的搭建门槛,属于面向开发者的平台体验与交付流程优化。
一则基准测试结果显示,GLM-5.2在特定硬件与推理框架下的生成吞吐量从此前约每秒280个token提升到318个token,且发布者表示仍有进一步优化空间。这个增量主要指向模型推理效率与部署性能的改善,会直接影响开发者评估成本、速度和推理栈优化方案。

6月25日收盘,日经225指数上涨4.61%至72366点,韩国KOSPI指数上涨5.4%至8930点,日韩两大主要股指当日同步显著走强。两国市场同日出现较大涨幅,直接释放亚太区域风险偏好回升的信号,也为判断跨市场资金情绪和市场联动提供了新的参考。

加拿大国防部长表示,已与日本防卫大臣就全球作战空中计划(GCAP)战斗机项目进行讨论,公开信号显示加拿大正评估与该多国下一代战机计划的合作空间。此举直接关联国际防务合作与地缘安全布局,也可能影响GCAP参与范围及相关军工技术协作预期。
MemeCore(M)据 OKX 行情在24小时内跌至0.67436美元,单日跌幅超过75%,市场同时质疑其约60亿美元估值是否合理,以及内部人士据称持有逾90%代币供应。价格急跌与筹码集中争议叠加,直接反映出该代币的流动性和治理风险,可能影响交易者对高估值小众加密资产的风险定价。

Runware 已在文档中上线 HappyHorse 1.1 使用指南,新增多角色定妆和电影式分镜能力,可将真实参考图像锁定到每个镜头,并从单一提示词生成多镜头连贯短片。这个更新直接提升了 AI 视频创作中角色一致性与叙事连贯性,对创作者工作流和相关生成式视频产品竞争都有实际影响。