,PC本地到智能导航电脑管家解救从暴力穷举查找被腾讯


文 | 智能相对论。解救

作者 | 叶远风。从暴查找

在文件资源管理器地址栏输入要害词,力穷按下回车后 ,导航体系开端了绵长的本地被腾扫描进程 ,硬盘被“仔仔细细”一个个文件进行对比,讯电然后慢悠悠把成果展现出来 ,脑管只能等候,解救着急又百般无法……。从暴查找

这是力穷许多人运用PC端本地查找时面对的常态 。

这肯定是导航不正常的 ,但长久以来,本地被腾从操作体系厂商 ,讯电到运用开发者 ,脑管再到千千万万的解救普通用户,都这么“将就”地过着。

现在,有人站出来想要处理这个问题。

最近,腾讯电脑管家晋级了本地查找的新功用,企图协助PC端的用户更好地进行本地查找——这个“不起眼”而又是打工人频频触摸的当地,总算有人开端关怀起来 。

PC本地查找“剪刀差”越来越大,却深陷“技能无视”  。

当时 ,PC本地查找实质上构成了一个才干与需求的“剪刀差”,且有不断增大的趋势 :

一边 ,是许多用户的PC装备并没有幻想的高,例如Win 11现已问世多年,但Win10依然占有着首要的市场比例,占比挨近7成 ,这其间旧款电脑预装win10没有进行晋级是首要原因;

另一边 ,全面数字化年代,普通用户日常作业日子堆集的数据量变得越来越大(铢积寸累的文档  、越来越高清的相片等等),本地查找对电脑功用的压力又变得越来越大。

这就需求一个产品  ,能够在满意需求的一起符合大部分用户的硬件才干 。但是,大环境上来看 ,整个PC运用开展所面对令人无法的“技能无视”现象 ,也即  ,分明现已有许多人看到了问题但没有人去采纳举动处理(个中原因说来话长,但客观成果现已注定) ,曩昔并没有人来做这样一件事 。

在手机这些移动终端上 ,一旦呈现卡顿、体会差,操作体系厂商 、运用厂商们会想方设法优化 、进步,并习惯尽或许多的机器类型。而在PC上 ,呈现包含查找在内的体会问题 ,许多人榜首反应是:怎样不去换个新电脑,进步一下装备(如装高速固态硬盘)?而没有人去责问:为何都2025年了,处处都是“用户是上帝”的理念 ,PC端却还在逼着用户去改动?

对本地查找的慢 、卡 ,业界好像现已“团体麻痹” 。

正是这个时分 ,腾讯电脑管家站了出来。

离别暴力穷举、迈向智能导航,PC本地查找体会再进化 。

腾讯电脑管家在做的 ,便是用技能立异消弭“剪刀差” ,让更多PC端用户能够很好地运用本地查找完结自己的检索需求。

这首要体现在有限资源下完结资源功率最大化。

腾讯电脑管家的本地查找是根据NTFS文件体系 ,直接解析NTFS文件体系中的主文件表(MFT)(这是一个完好记载了本地一切文件的根底信息的躲藏文件),获取包含文件名、巨细 、修正时刻等元数据。

传统操作体系查找选用的是递归遍历磁盘方法,浅显说就好像查户口一家一家去敲门、找到了才算。而腾讯电脑管家的方法,是直接读取硬盘体系(NTFS)内部记载一切文件信息的“总户口本”(MFT),瞬间知道一切文件在哪 、叫啥名。

这是一种底层解析方法,能够大幅进步索引的速度和准确性,一起下降体系资源耗费。

这种方法,也顺便处理了文件实时改变感知的问题 。

在传统查找中,假如文件发生了修改 ,则需求过一段时刻或许下次全盘扫才干发现,即时性、准确性缺乏。而腾讯电脑管家充分运用了NTFS的UsnJrnl(文件改变日志)完结对文件增修改等操作的实时感知,能够实时捕获增修改事情 ,防止全盘扫描的资源糟蹋,索引更新零推迟,保证查找成果实时性 。

这就比如体系有一个自带的“改变小本本”(UsnJrnl) ,而腾讯电脑管家一向盯着“小本本”看,索引瞬间更新  ,搜出来的成果永远是最新的 。

除了方法上的立异 ,在才干上,腾讯电脑管家也在协助用户发掘PC的潜力。

当下的PC端处理器都为多核处理器 ,多核协同才干是许多PC运用重点发力的方向(例如3A游戏进步多核功用下降对显卡的需求) 。腾讯电脑管家相同如此 ,其在文件查找环节立异选用多线程并发检索机制,针对不同磁盘分区分配独立线程,充分运用多核CPU资源——“人多力量大”,一起派好几个“线程小工”去不同的区域找材料,这无疑能进步大规模文件检索功率,深层目录/大文件夹场景呼应也会更快 。

那种传统查找“一核作业,多核围观”的状况在这儿不会再有 。

由此 ,经过底层原生解析  、实时改变感知、多线程优化等立异技能手段,腾讯电脑管家处理了传统文件检索计划在功用 、实时性和资源占用等方面的痛点 ,具有显着的技能抢先性和职业影响力。

值得一提的是,腾讯电脑管家这套产品架构规划有杰出的开放性和可扩展性,能够内嵌到许多其他运用傍边,现在其乃至对外提供有SDK供第三方运用  。

而不止于查找功用的进步 ,腾讯电脑管家还着手处理PC用户在查找体会上的一些深度需求 ,这使得其能够成功差异于Everything等常用的单一功用查找软件 ,具有更多立异价值。

这首要体现在三个方面 。

1 、随意搜。

许多用户在查找时,只记住文件名的一部分,写不全 ,或许有特别的要害词匹配需求 ,传统查找的准确率欠安。

腾讯电脑管家让用户能够为所欲为“把戏搜” :支撑含糊匹配(记不全也能搜) 、前缀匹配(输入最初就行) 、乃至正则表达式(高档用户),还能智能处理中英文混输  、特别符号 ,例如输入“2024 陈述”或许找到“2024年度总结陈述.docx”,然后削减无效匹配,进步杂乱要害词的查找准确率与速度 。

2 、内容深化搜  。

用户往往不满意只查找文件名  ,需求进行文件内容的深化、准确查找。腾讯电脑管家的本地查找支撑多种文档内容全文检索精准 ,支撑含糊匹配与多要害词组合。

这其间牵扯许多细节技能。

首要是怎么对文档内容进行解析 。这方面腾讯电脑管家在内容索引阶段运用IFilter接口和自研的XML解析模块,能够主动解析并提取常见文档格局(如PDF、Word、PPT、Excel等)的文本内容,极大进步了多格局文档的兼容性和解析功率 。

解析后 ,是怎么进行索引 。腾讯电脑管家选用jieba分词算法进行高效分词 ,并对分词成果进行去重处理 ,构成“文档-词列表”的对应联络调集,随后,体系根据分词成果反向树立“分词-文档列表”的倒排索引结构  。

这等于自己构建了一个“要害词地图” ,当用户查找文档内容时 ,直接“查地图”就能瞬间找到一切相关文档 ,不必再挨个翻开文件去读  ,速度极快,不只进步了检索功用 ,还明显下降了体系资源耗费。

3 、多模态搜 。

用户日常需求查找的内容早已不只要文档,各类图片比例越来越大,一些创造类用户或许日常首要需求的便是查找图片。

腾讯电脑管家在这方面支撑内容/人脸/OCR多维度查找 ,如人脸聚类主动归档 、OCR提取图中文字等 。

在AI模型的协助下 ,腾讯电脑管家能够辨认图片里有什么东西(物品分类,预练习模型辨认内容)、是谁(人脸辨认聚类,经过5点校对+特征向量提取+HDBSCAN聚类技能) 、乃至图片里的文字(飞桨开源模型,OCR文字辨认) 。

如此 ,用户就能搜“猫的相片”、“张三的相片”  、“包含‘发票’文字的截图”等等 ,多种模态查找愈加为所欲为 。

当然 ,这些立异背面还离不开腾讯电脑管家在文档分类方面的技能探究 ,现在其现已构成“快速阅读内容-提取特征要害词-要害词云端AI大模型剖析-智能判别文档类型”的智能文档归类进程 ,协助进步检索功率和质量。

总而言之 ,在一系列技能立异下,腾讯电脑管家让本地查找彻底离别暴力穷举,而正在成为用户PC端上的智能导航,体会得到了极大进步。

与数据密切触摸,隐私安满是最终一道关卡。

任何技能立异除了处理旧有痛点 ,许多时分也引发新的忧虑,例如大模型的运用就带来隐私安全的忧虑。

与用户数据密切触摸,搜文档内容、辨认图片人脸,这些功用听着好用 ,但一些用户或许会忧虑运用把私家文件内容都上传到服务器 。而在腾讯电脑管家这儿,这种忧虑能够彻底放下 。

在进步查找体会的一起 ,腾讯电脑管家对用户隐私安全也有齐备的保证:

1、数据本地化处理——“活都在家干”,文件内容解析 、图片人脸辨认/OCR、文档特征提取均在设备端完结 ,原始数据不上传云端。

2 、最小化数据传输——“只传纸条不传原件” ,只要文档智能分类这一步需求用到云端大模型,但上传的不是文档原文,而是电脑本地提取出来的几个要害词和文件名 。

3、免第三方依靠——“不依靠外人” ,文件索引的中心(读MFT和UsnJrnl)直接用Windows体系自带的机制 ,不依靠或许有危险的第三方软件库。

能够说,腾讯电脑管家既让用户找文件快如闪电(底层读取+实时更新+多核并行) ,又让用户搜得又全又准(文件名把戏搜+文档内容挖得深+图片看得懂) ,在收拾文件上也更智能(AI帮助分类),而最要害的是 ,做这些事的时分用户的隐私文件安全有保证(要害操作本地做 ,灵敏内容不上传) 。

如此 ,用户在电脑上找材料时遇到的烦心事都被考虑到  ,而且用技能手段进行处理 。PC运用,也能够斗胆谈用户体会了。

*本文图片均来源于网络。

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方法运用 ,包含转载、摘编、仿制或树立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵略  ,请作者与咱们联络。

特别声明 :本文为协作媒体授权专栏转载 ,文章版权归原作者及原出处一切。文章系作者个人观点 ,不代表专栏的态度 ,转载请联络原作者及原出处获取授权 。(有任何疑问都请联络idonewsdonews.com)。

本文地址:https://jxj2.dezhouruihuan.com/tansuo

发表评论

您的电子邮件地址不会被公开,必填项目已做标记*