巴西足球
精通特征工程
9推荐 收藏
8.9K阅读
图灵程序设计丛书

精通特征工程

爱丽丝·郑 , 阿曼达·卡萨丽 (作者) 陈光欣 (译者)
通过Python示例掌握特征工程基本原则和实际应用,增强机器学习算法效果
本书介绍大量特征工程技术,阐明特征工程的基本原则。主要内容包括:机器学习流程中
的基本概念,数值型数据的基础特征工程,自然文本的特征工程,词频- 逆文档频率,高效的分类变量编码技术,主成分分析,模型堆叠,图像处理,等等。

收藏本书能做什么?

有情况的时候会收到通知,比如电子书发布等。

PS:也会在图灵社区电报频道更新

电子书
¥15.00 ¥29.99
格式
mobi   pdf

纸质书
¥48.38 ¥59.00

出版信息

  • 书  名精通特征工程
  • 系列书名图灵程序设计丛书
  • 执行编辑关于本书的内容有任何问题,请联系 岳新欣
  • 出版?#25484;?/strong>2019-04-15
  • 书  号978-7-115-50968-0
  • 定  价59.00 元
  • 页  数156
  • 印刷方式单色
  • 开  本16开
  • 出版状态上市销售
  • 原书名Feature Engineering for Machine Learning Models: Principles and Techniques for Data Scientists
  • 原书号9781491953242

所属分类

  • JavaScript高级程序设计(第3版)

    Nicholas C.Zakas   李松峰   曹力   译

    本书是JavaScript超级畅销书的新版。ECMAScript 5 和HTML5在标准之争中双双胜出,使大量...

  • 计算机科学的基础

    Al Aho   Jeff Ullman   傅尔也   译

    本书全面而详?#20613;?#38416;述了计算机科学的理论基础,从抽象概念的机械化到各种数据模型的建立,用算法、数据抽象等核心思想...

  • Java技术手册(第6版)

    Benjamin J Evans   David Flanagan   安道   译

    通过学习本书,你将能够: 掌握最新的语言细节,包括Java 8的变化 使用基本的Java句法学习面向对...

  • 机器学习实战

    Peter Harrington   李锐   李鹏   曲亚东   王斌   译

    机器学习是人工智能研究领域中一个极其重要的研究方向,在?#32440;?#30340;大数据时代背景下,捕获数据并从中萃取有价值的信息或...

  • 本书特色

    特征工程是机器学习流程中至关重要的一个?#26041;冢?#28982;而专门讨论这个话题的著作却寥寥无几。本书旨在填补这一空白,着重阐明特征工程的基本原则,介绍大量特征工程技术,教你从原始数据中提取出正确的特征并将其转换为适合机器学习模型的格式,从而轻松构建模型,增强机器学习算法的效果。

    然而,本书并非单纯地讲述特征工程的基本原则,而是通过大量示例和练习将重点放在了实际应用上。每一章?#25216;?#20013;研究一个数据问题:如何表示文本数据或图像数据,如何为自动生成的特征?#26723;?#32500;度,何时以及如何对特征进行标准化,等等。最后一章通过一个完整的例子演示了多种特征工程技术的实际应用。书中所有代码示例均是用Python编写的,涉及NumPy、Pandas、scikit-learn和Matplotlib等程序包。

    - 数值型数据的特征工程:过滤、分箱、缩放、对数变换和指数变换
    - 自然文本技术:词袋、n元词与短语检测
    - 基于频率的过滤和特征缩放
    - 分类变量编码技术:特征散列化与分箱计数
    - 使用主成分分析的基于模型的特征工程
    - 模型堆叠与k-均值特征化
    - 图像特征提取:人工提取与深度学习

    目录

    版权声明 阅读
    O'Reilly Media, Inc. 介绍 阅读
    前言 阅读
    第 1 章 机器学习流程 阅读
    第 2 章 简单而又奇妙的数值
    第 3 章 文本数据:扁?#20132;?#36807;滤和分块
    第 4 章 特征缩放的效果:从词袋到 tf-idf
    第 5 章 分类变量:自动化时代的数据计数
    第 6 章  数据降维:使用 PCA 挤压数据
    第 7 章 非线性特征化与 k-均?#30340;?#22411;堆叠
    第 8 章 自动特征生成:图像特征提取和深度学习
    第 9 章 回到特征:建立学术论文推荐器
    附录 A 线性建模与线?#28304;?#25968;基础
    作者简介 阅读
    封面简介 阅读

    作者介绍

    爱丽丝·郑(Alice Zheng) 亚马逊广告平台建模和优化团队负责人,应用机器学习、生成算法?#25512;教?#24320;发领域的技术领导者,前微软研究院机器学习研究员。

    阿曼达·卡萨丽(Amanda Casari) 谷歌云开发者关系工程经理,曾是Concur Labs的产品经理和数据科学家,在数据科学、机器学习、?#19995;?#31995;统和机器人等多个领域都有丰富经验。

    大家也喜欢

    • Python数据科学与机器学习:从入门到实践

      【美】弗兰克?凯恩(Frank Kane)   陈光欣   译

      本书介绍了使用Python进行数据分析和高效的机器学习,首先从一节Python速成课开始,然后回?#36865;?#35745;学和概率...

    • 深入理解Python特性

      [德]达恩·巴德尔(Dan Bader)   孙波翔   译

      本书致力于帮助Python开发人员挖掘这门语言及相关程序库的优秀特性,避免重复劳动,同时写出简洁、流畅、易读、...

    • 本书?#28304;?#38646;开发一个博客系统为例,介绍Django在日常工作中的应用。 本书共分为四部分。第一部分介绍编码之前...

  • 本书旨在介绍开源的Python算法库和数学工具包SciPy。近年来,基于NumPy和SciPy的完整生态系统迅...

  • Flask Web开发:基于Python的Web应?#27599;?#21457;实战(第2版)

    [美]米格尔?格林贝格   安道   译

    本书共分三部分,全面介绍如何基于Python微框架Flask进行Web开发。第一部分是Flask简介,介绍使用...

    • Feature Engineering一般应该翻译为特征工程吧
      fantasma  发表于 2018-05-08 23:11:37
      推荐
    • 这本书啥时候能出来啊?有电子版不?
      郝林  发表于 2018-12-12 16:14:16
      推荐
    • 电子书啥时候出来
      机器小白  发表于 2019-03-20 11:04:33
      推荐
    • 这本书什?#35789;?#20505;出来啊
      abing  发表于 2019-04-01 15:57:29
      推荐
      • 即将开始印刷,预计4月中旬会出版?#28023;?/p>

        岳新欣  发表于 2019-04-01 17:34:33
    • 电子版购买之后就会发送吗?
      美的?#20154;?#22774;  发表于 2019-04-08 17:13:46
      推荐
      • 您好,电子书的相关说明请见http://www.sgmxp.tw/article/497743

        岳新欣  发表于 2019-04-09 08:53:59
      • @岳新欣 同问,这本书的电子书购买了会发货吗?因为显示“预售”,不知道购买了是否还是要跟纸质书一样需要等? 您发送的这个链接中没有针对该问题有用的信息

        kidzying  发表于 2019-04-09 18:32:32
      • @kidzying 直接可以下载pdf文件

        coderzc  发表于 2019-04-09 22:16:29
      • 购买之后就可以下载的。

        岳新欣  发表于 2019-04-10 09:01:10
    • 附带的源代码只有代码文件,没有对应的数据文件,导致代码没有办法运行。这个问题如何解决。
      coderzc  发表于 2019-04-09 22:15:46
      推荐
      • “随书下载”中新增了几个数据集的下载链接,请看看能否解决您的问题。

        岳新欣  发表于 2019-04-10 08:57:35
      • @岳新欣 谢?#25442;馗础?#19981;过有些链接的数据集对不上。在3.1.2节使用的数据集是challenge 6的,但是链接中只有challenge 13。

        coderzc  发表于 2019-04-10 11:55:11
      • 我也?#22411;?#24863;,而且数据集找起来好麻?#24120;?#25105;都没有找到。

        送你一匹马  发表于 2019-07-05 21:17:14
      • @coderzc数据集的下载链接在哪里?#35838;以?#20040;一直没找到呢?

        送你一匹马  发表于 2019-07-05 21:24:09
    • 请问 第 9 章 回到特征:建立学术论文推荐器 中的数据集要在哪里找呢 随书下载的文档里也没提
      Hendyzone  发表于 2019-04-15 17:33:45
      推荐
      • 请试试https://www.openacademic.ai/oag/

        岳新欣  发表于 2019-04-16 08:53:07
      • @岳新欣 找到了 ?#34892;?/p>

        Hendyzone  发表于 2019-04-17 09:25:55
    • 已购电子版,特征工程一起学习交流可加微信yulianghao809
      奔跑的海盗会笑  发表于 2019-04-22 16:19:34
      推荐
    • 第8页 ——“在百万歌曲数据集中,原始的收听次数并不是衡量用户喜好的强壮指标。”“强壮”不应该是鲁棒吗
      caroline_123  发表于 2019-05-03 19:29:31
      推荐
    • 本书应?#38376;?#22871;数据集,而不是提供下载地址自行下载,因为下载的数据集很多?#29615;?#21512;原代码的要求
      ranranV  发表于 2019-05-19 15:19:33
      推荐
    • 很好的书,另外第六章标题多了一个空格,能否去除
      樊睡懒觉  发表于 2019-05-24 20:10:20
      推荐
    • 理解错了标题,本来以为第8章讲了图像的前处理技术。结果讲的是DNN各层对图像的处理。。。
      vpoint  发表于 2019-06-21 16:22:48
      推荐
    • ?#19978;?#27491;文内容没有预览,不能先试读一下看需不需要买。
      zwang  发表于 2019-06-28 11:06:02
      推荐
    巴西足球 重庆时时彩开奖直播版 重庆时时彩玩法 皇家贝蒂斯和莱万特 新浪彩票-足彩分析 美因茨大学怎么样 卡昂沙发布艺 爱彩乐11选5 捕鱼来了游戏攻略 埃弗顿著名的球员 船长的宝藏客服