VecDB@ICML2025 里有趣的论文
整理 VecDB@ICML2025 里有趣的论文,主要是关于 vector database 和 approximate nearest neighbor (ANN) 的。
九百六十万平方公里土地,五千年文明,十三亿人口…… 如果要建一座通天塔的话,再没有比这里更理想的地基了……
—— 杨叛《北京战争》
Hi👋! I’m Qin Liu. Here are my links:
整理 VecDB@ICML2025 里有趣的论文,主要是关于 vector database 和 approximate nearest neighbor (ANN) 的。
本文深入解析 SPTAG、SPANN 和 SPFresh 三种向量检索技术的演进脉络,从树图混合索引到磁盘分区存储,再到增量更新与自平衡机制,揭示亿级向量检索的技术细节与优化策略。
通过 RaBitQ 向量量化算法从 C++ 到 Rust 的实际移植项目,对比 Claude Code 和 Codex 两大 AI 编程工具的真实表现。Claude Code 在一天内将性能从慢 10 倍优化到接近 C++ 水平,展现出深度代码理解、主动问题诊断和系统性优化能力。
解析字节跳动开源的屏幕记录 AI 工具 MineContext,与 Rewind AI、screenpipe、DayFlow 等对比,展示其混合架构的平衡与妥协。
深度解析字节跳动 Coze Studio+Loop 与国际社区 Dify+Langfuse 两大 AI 开发平台的技术架构差异,从开源策略到组件对比,揭示闭环一体化与拼装式生态的本质区别。