0 0 0

Java中文文本信息处理(从海量到精准).pdf

Mole泪痣
2天前 120
我用夸克网盘分享了「Java中文文本信息处理(从海量到精准).pdf」,点击链接即可保存。打开「夸克APP」在线查看,支持多种文档格式转换。
Java中文文本信息处理 作者: 罗刚 出版社: 清华大学出版社 副标题: 从海量到精准 出版年: 2017-5 页数: 396 装帧: 平装 ISBN: 9787302469360

内容简介

全书以零基础的读者自学完成一个中文分词系统作为目标。从Java基础语法开始,然后到文本处理相关的数据结构和算法,*后实现文本切分和词性标注。本书是少有的介绍业界热门的Java开发中文分词的书籍。本书选取相关领域的经典内容深入理解和挖掘,也综合了实践性强的创新想法。适用于对软件开发感兴趣的青少年或者大学生。

作者简介

罗刚,计算机软件硕士,毕业于吉林工业大学。2005年创立北京盈智星科技发展有限公司,2008年联合创立上海数聚软件公司。猎兔搜索创始人,当前猎兔搜索在北京和上海以及石家庄均设有研发部。带领猎兔搜索技术开发团队先后开发出猎兔中文分词系统、猎兔文本挖掘系统,智能垂直搜索系统以及网络信息监测系统等,实现互联网信息的采集、过滤、搜索和实时监测,其开发的搜索软件日用户访问量达万次以上。

图书目录

第1章Java软件开发 11.1背景31.1.1好身体是一切成功的保证31.1.2路线图41.1.3Java41.2软件工具71.2.1搜索引擎71.2.2Windows命令行81.2.3机器翻译91.2.4Linux101.2.5源代码比较工具111.3Java基础111.3.1准备开发环境111.3.2Eclipse131.4本章小结17 第2章结构化程序设计19 2.1基本数据类型192.2变量202.2.1表达式执行顺序222.2.2简化的运算符232.2.3常量242.3控制结构252.3.1语句252.3.2判断条件252.3.3三元运算符272.3.4条件判断272.3.5循环312.4方法362.4.1main方法412.4.2递归调用412.4.3方法调用栈422.5数组422.5.1数组求和452.5.2计算平均值举例452.5.3前趋节点数组462.5.4快速复制472.5.5循环不变式492.6字符串502.6.1字符编码522.6.2格式化532.6.3增强switch语句542.7数值类型542.7.1类型转换582.7.2整数运算592.7.3数值运算602.7.4位运算612.8安装Java692.8.1服务器端安装692.8.2自动安装Java702.9提高代码质量722.9.1代码整洁722.9.2单元测试722.9.3调试732.9.4重构732.10本章小结74 第3章面向对象编程77 3.1类和对象773.1.1类783.1.2类方法783.1.3类变量793.1.4实例变量793.1.5构造方法823.1.6对象843.1.7实例方法873.1.8调用方法893.1.9内部类893.1.10克隆903.1.11结束913.2继承923.2.1重写923.2.2继承构造方法943.2.3接口953.2.4匿名类983.2.5类的兼容性983.3封装983.4重载993.5静态1003.5.1静态变量1003.5.2静态类1003.5.3修饰类的关键词1013.6枚举类型1013.7集合类1053.7.1动态数组1053.7.2散列表1063.7.3泛型1093.7.4GoogleGuava集合1123.7.5类型擦除1123.7.6遍历1143.7.7排序1173.7.8lambda表达式1193.8比较1193.8.1Comparable接口1193.8.2比较器1203.9SOLID原则1223.10异常1233.10.1断言1233.10.2Java中的异常1243.10.3从方法中抛出异常1263.10.4处理异常1283.10.5正确使用异常1303.11字符串对象1323.11.1字符对象1353.11.2查找字符串1353.11.3修改字符串1363.11.4格式化1363.11.5常量池1373.11.6关于对象不可改变1393.12日期1403.13大数对象1413.14给方法传参数1423.14.1基本类型和对象1433.14.2重载1453.15文件操作1463.15.1文本文件1463.15.2二进制文件1493.15.3文件位置1523.15.4读写Unicode编码的文件1533.15.5文件描述符1553.15.6对象序列化1563.15.7使用IOUtils1603.16Java类库1613.16.1使用Java类库1623.16.2构建JAR包1633.16.3使用Ant1673.16.4生成JavaDoc1673.16.5ClassLoader1683.16.6反射1723.17编程风格1733.17.1命名规范1733.17.2流畅接口1743.17.3日志1753.18IDEA1813.19实例1813.20本章小结183 第4章处理文本185 4.1字符串操作1854.2有限状态机1884.2.1从NFA到DFA1904.2.2DFA1944.2.3DFA交集1974.2.4DFA并集2034.2.5有限状态转换2044.3本章小结207 第5章数据结构209 5.1链表2095.2树算法2105.2.1标准Trie树2115.2.2链表Trie树2215.2.3二叉搜索树2235.2.4数组形式的二叉树2275.2.5三叉Trie树2335.2.6三叉Trie树交集2445.2.7Trie树词典2455.2.8平衡Trie树2495.2.9B树2505.3双数组Trie2515.4队列2575.4.1链表实现的队列2575.4.2优先队列2585.4.3找出前k个*大的元素2615.5堆栈2625.6双端队列2645.7散列表2685.7.1快速查找的散列表2695.7.2HashMap2725.7.3应用散列表2765.7.4开放式寻址2795.7.5布隆过滤器2825.7.6SimHash2845.8图2865.8.1表示图2875.8.2遍历图2955.9大数据2975.10本章小结297 第6章算法299 6.1贪婪法2996.2分治法3016.3动态规划3026.4在中文分词中使用动态规划算法3036.5本章小结310 第7章最长匹配分词311 7.1正向最大长度匹配法3127.2逆向*大长度匹配法3167.3处理未登录串3207.4开发分词3247.5本章小结326 第8章概率语言模型的分词方法327 8.1一元模型3288.2整合基于规则的方法3348.3表示切分词图3368.4形成切分词图3428.5数据基础3448.5.1文本形式的词表3448.5.2数据库词表3488.6改进一元模型3498.7二元词典3528.8完全二叉数组3578.9三元词典3608.10N元模型3618.11N元分词3628.12生成语言模型3688.13评估语言模型3698.14概率分词的流程与结构3708.15本章小结371 第9章词性标注 3739.1数据基础3769.2隐马尔科夫模型3779.3存储数据3859.4统计数据3909.5整合切分与词性标注3929.6知识型词性序列标注3969.7本章小结396 参考资源397 后记398

Java中文文本信息处理(从海量到精准).pdf"网盘下载"

版权说明

1、本站不保存、不存储任何实质资源,以上二维码指向为网盘资源链接,其内容归对应版权方所有
2、如有侵犯版权的情况,请点击下面举报/反馈按钮反馈或发送邮件[email protected]投诉说明情况
3、我们核实后将第一时间删除相关页面内容,谢谢理解和配合

这些人下载过 (12)
  • 晚春里
  • 烈焰刀
  • 秉舟
  • 扶旅
  • 与其在你不要的世界里
  • 染指莘夏
  • 最深遗憾
  • Insane失控
  • 先舔一舔我不想泡一泡
  • 我把最爱的你给了他
  • 夜的诗篇
  • 晨之光
最新回复 (0)

    暂无评论

请先登录后发表评论!

返回
请先登录后发表评论!