
会员
自己动手写搜索引擎
更新时间:2018-12-28 22:52:39 最新章节:参考资料
书籍简介
本书是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。本书全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。
上架时间:2009-12-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
最新上架
- 会员本书书分为以下几部分:第一部分:预备知识:介绍数据结构和算法的基本概念,并演示如何搭建开发环境、编写测试用例。第二部分:数据结构:介绍常见的数据结构,包括数组、链表、矩阵、栈、队列、跳表、散列、树、图等。第三部分:常用算法:介绍常用的算法,包括分而治之、动态规划、贪婪算法、回溯、分支界定、遗传算法等。第四部分:商业实战:介绍汉诺塔及五子棋两款游戏的实现。计算机0字
- 会员本书立足于新工科和工程教育,从工程应用和实践者的视角,全面系统地介绍了目前在工业界中使用最为广泛的JDK8的全部核心知识。全书共17章,主要内容包括Java概述、Java基本类型与运算符、程序流程控制、数组、类与对象、抽象类、接口与嵌套类、GUI编程、Swing高级组件、异常与处理、I∕O流与文件、多线程与并发、容器框架与泛型、字符串与正则表达式、反射与注解。本书适合可作为普通高等院校、高职院校计算机21万字
- 会员本书主要内容包括Go语言简介、开发环境准备、快速基础入门、数学科学领域的计算、开发一个自己的日常命令行工具、文件处理、数据格式分析与转换、正则表达式、并发处理、数据采集和清理应用、网络服务端应用、Web服务器、加密解密领域应用、网络提供的各种API、常用Go语言技术的示例与研究、实用函数实例等。安排了大量实例代码,介绍相关编程知识。计算机27万字
- 会员本书从分布式系统的基础概念讲起,随后介绍分布式系统中间件SpringCloudAlibaba进阶实战,重点介绍了使用SpringCloudAlibaba框架整合各种分布式组件的完整过程。计算机3.1万字
- 会员随着JDK的升级与迭代,SpringFramework与SpringBoot也分别升级到了全新的6.0与3.0版本,全新的版本带来了更加强大的功能和特性。本书侧重于核心功能和特性的讲解,重点讲解SpringFramework与SpringBoot在应用开发中的核心与应用,通过多个方面介绍应用开发中涉及的场景。本书分为六个部分,共15章。第一部分~第三部分介绍SpringFramework计算机21.5万字
- 会员本书主要介绍iOS自动化测试的相关内容。本书首先介绍iOS基础知识;接着介绍测试环境部署、Appium基本操作和Appium终端操作,为读者学习后面的知识打下基础;然后介绍Appium中的元素定位、元素操作、高级操作、等待机制;最后讲述Pytest测试框架、项目实战、项目代码优化、自动化测试框架开发等。本书适合测试人员和开发人员阅读。计算机8.7万字
- 会员《餐饮管理与经营全案——互联网思维创新餐饮管理和运营模式》一书,从互联网思维下的餐饮变革导入,分三个部分。第一部分(互联网思维创新之系统智能化)包括智能餐饮管理系统,智能点餐系统建设,智能结算系统建设,智能厨房显示系统建设,外卖业务系统建设,食品安全管控系统建设。第二部分(互联网思维创新之营销多样化)包括微博营销,微信公众号营销,短视频营销,会员大数据营销,外卖平台营销。第三部分(互联网思维创新之计算机10万字
同类书籍最近更新
- 会员本书是一本聚焦RAG技术实践与落地的专业技术书,分为四部分。第一部分是RAG技术基础,介绍了RAG技术的定义、发展背景、核心组成以及落地面临的挑战,同时深入探讨了RAG技术背后的原理。第二部分是RAG应用构建流程,详细讲解了RAG应用的各个环节,从数据准备与处理,到检索环节的优化,再到生成环节的技巧。第三部分是RAG技术进阶,主要介绍了RAG系统的高级优化策略、常见框架的实现原理与性能评估方法。第程序设计11.8万字
- 会员Python的Django框架是目前流行的一款重量级网站开发框架,具备简单易学、搭建快速、功能强大等特点。本书从简单的HTML、CSS、JavaScript开始介绍,再到Django的基础知识,融入了大量的代码案例、重点提示、图片展示,做到了手把手教授。本书基于Django3.0.7版本、Python3.8.5版本、RestFramework3.11.1版本、Vue.js4.5.4版本、程序设计15.3万字
- 会员全书共分为3篇:基础篇、方案篇和参考篇,按照“基本原理”→“生产实践”→“更多参考”的逻辑顺序讲述,书中配了大量的原理与方案示意图,力求用通俗易懂的语言、直观明了的示意图、完整的知识涵盖面将MySQL的复制技术讲透。其中,基础篇侧重介绍主从复制的原理和复制技术的演进,方案篇侧重介绍主从复制技术在生产环境中的应用方案,参考篇侧重介绍二进制日志的基本组成以及主从复制中常见对象复制的安全性等。程序设计14.9万字
- 会员本书是一本基于互联网真实案例编写的Java设计模式实践图书。全书以解决方案为核心,从实际开发业务中抽离出交易、营销、规则引擎、中间件、框架源码等22个真实场景,对设计模式进行全面、彻底的分析。帮助读者灵活地使用各种设计模式,从容应对复杂变化的业务需求,编写出易维护、可扩展的代码结构。本书融合了生动有趣的动画插图和实践开发的类结构图,让读者不仅能体会设计模式的概念和原理,更能清楚地知晓落地方法。此外程序设计8.2万字