0 0 0

文本挖掘:基于R语言的整洁工具.epub

在爱的路上等你
6天前 140
我用夸克网盘分享了「文本挖掘:基于R语言的整洁工具.epub」,点击链接即可保存。打开「夸克APP」在线查看,支持多种文档格式转换。
文本挖掘 作者: [美] Julia Silge/[美] David Robinson 出版社: 机械工业出版社 副标题: 基于R语言的整洁工具 原作名: Text Mining with R: A Tidy Approach 译者: 刘波/唐亮贵/罗棻 出版年: 2018-1 页数: 160 定价: 59.00元 装帧: 平装 丛书: O'Reilly动物系列(中译本) ISBN: 9787111588559

内容简介

当前很多数据都是非结构化的大规模文本,这给分析和可视化带来了挑战。本书使用实用的tidytext软件包来介绍文本挖掘技术,该包是由Julia Silge和David Robinson共同开发的R软件包(类似于ggplot2和dplyr软件包),开发时采用了整洁原则。本书将会介绍如何利用tidytext以及其他整洁工具使文本分析变得更容易、更有效。 本书展示如何将文本转换为数据框,然后提取和可视化文本的特征;并介绍如何将自然语言处理(NLP)融入有效的工作流程中;实用的代码示例和数据分析将帮助你了解文学作品、新闻和社交媒体中的有用信息。

作者简介

Julia Silge Stack Overflow 数据科学家,负责复杂数据集分析及与不同受众进行技术主题交流。拥有天体物理学博士学位,热爱简·奥斯汀和制作美丽的图表。 David Robinson Stack Overflow 数据科学家,普林斯顿大学定量与计算生物学博士。喜欢开发开源R包,包括 broom、gganimate、fuzzyjoin 和 widyr,还喜欢撰写统计、R和文本挖掘等方面的博客。

网友热评

Net Garden: 不错的书,亮点是非常tidy的代码,内容比较简单,而且是面向英文的

图书目录

译者序 前言 第1章整洁文本格式 比较整洁文本结构与其他数据结构 unnest_tokens函数 整理JaneAusten的作品 gutenbergr包 词频 总结 第2章基于整洁数据的情感分析 情感数据集 内连接的情感分析 比较三个情感词典 最常见的正面单词和负面单词 Wordclouds模块 除单词外的其他文本单元 总结 第3章分析词和文件频率:tf-idf JaneAusten小说中的词项频率 Zipf定律 bind_tf_idf函数 物理学语料库 总结 第4章词之间的关系:n-gram及相关性 n-gram词条化 用widyr包对单词对计数并计算相关性 总结 第5章非整洁格式转换 使文档–词项矩阵整洁 将整洁文本数据转换为矩阵 总结 第6章主题建模 LDA 示例:博大的图书馆馆藏 LDA方法的替代实现 总结 第7章案例研究:Twitter归档文件比较 单词使用情况的比较 单词使用情况的变化 收藏和转发 总结 第8章案例研究:NASA元数据挖掘 NASA如何组织数据 共现单词与相关单词 计算描述字段的tf-idf 总结 第9章案例研究:分析Usenet文本 预处理 新闻组中的单词 情感分析 总结 参考文献

文本挖掘:基于R语言的整洁工具.epub"网盘下载"

版权说明

1、本站不保存、不存储任何实质资源,以上二维码指向为网盘资源链接,其内容归对应版权方所有
2、如有侵犯版权的情况,请点击下面举报/反馈按钮反馈或发送邮件76556431@qq.com投诉说明情况
3、我们核实后将第一时间删除相关页面内容,谢谢理解和配合

这些人下载过 (12)
  • cathy(凯丝)
  • 做个不倾国的耀眼男子
  • 不欠别人
  • 泪咽无声
  • 空白的我
  • 我不会写诗
  • 梦吹角
  • 野鹤归山
  • 精致妆容
  • 雕刻成花
  • 情话梦一场
  • 你疲惫的目光总叫我放开
最新回复 (0)

    暂无评论

请先登录后发表评论!

返回
请先登录后发表评论!