Skip to content

Commit

Permalink
Browse files Browse the repository at this point in the history
  • Loading branch information
szcf-weiya committed Oct 10, 2023
1 parent 77e2237 commit c4e2b37
Showing 1 changed file with 3 additions and 3 deletions.
Original file line number Diff line number Diff line change
Expand Up @@ -3,8 +3,8 @@
原文 | [The Elements of Statistical Learning](https://web.stanford.edu/~hastie/ElemStatLearn/printings/ESLII_print12.pdf#page=28)
---|---
翻译 | szcf-weiya
发布 | 2016-09-30
更新 | 2018-08-21
发布 | 2016-09-30
更新 | {{ git_revision_date }}
状态 | Done

这些例子中的输出变量本质都不相同.在预测葡萄糖的例子中,输出变量是 **定量 (quantitative)** 的度量,有些度量大于其他的,而且测量结果在数值上相近也意味着结果本质上相近.著名的 R.A.Fisher 分辨鸢尾花种类例子中,输出变量(鸢尾花的种类)是 **定性的 (qualitative)** 而且假设取值为有限集合 ${\cal G}=\\{Virginica,Setosa,Versicolor\\}$.在手写数字的例子中,输出变量的取值是 $10$ 个不同数字之一:${\cal G}=\\{0,1,...,9\\}$.在这些例子中分类没有明显的顺序,而且事实上经常用描述性标签而不是数字来代替这些分类.定性变量也被称为 **类别型 (categories)** 或者 **离散 (discrete)** 型变量,也被称作 **因子 (factors)**
Expand All @@ -13,7 +13,7 @@

输出类型的差别导致对预测的命名规定:当我们预测定量的输出时被称为 **回归 (regression)**,当我们预测定性的输出时被称为 **分类(classification)**.我们将会看到这两个任务有很多的共同点,特别地,两者都可以看成是函数逼近.

输入变量也有各种各样的测量类型;我们可以有定性的输入变量和定量的输入变量两者中的一些变量.这些也导致了预测中方法类型的不同:一些方法更自然地定义为定量的输入变量,一些方法更自然地定义为定性的输入变量,还有一些是两者都可以的
输入变量同样有多种度量类型;我们可以有一些定性和定量输入变量的组合. 这些差异也导致了用于预测的方法类型的区分:某些方法最适合于定量的输入变量,某些方法最适合于定性的输入变量,还有一些适用于两者

第三种变量类型是 **有序分类 (ordered categorical)**,如 **小(small)****中 (medium)****大 (large)**,在这些值之间存在顺序,但是没有合适的度量概念(中与小之间的差异不必和大与中间的差异相等).这将在[第四章](../04-Linear-Methods-for-Classification/4.1-Introduction/index.html)中讨论.

Expand Down

0 comments on commit c4e2b37

Please sign in to comment.