手机浏览器扫描二维码访问
1、将特征重要程度排序的过程与模型构建过程同时进行的特征选择方法称作嵌入式特征选择方法(
√
)2、线性回归模型的目标函数为残差平方和最大化(残差平方和最小化
)3、特征向量中心度度量节点在网络中的影响力。网络中每个节点被赋予一个影响力分数,一个节点与更多的高分节点相连,其分数也趋向于更高。(
√
)4、强化学习使用已标记的数据,根据延迟奖励学习策略。(
未标记的数据,通过与环境的交互来收集数据进行学习
)5、过拟合是机器学习中一个重要概念,是指模型过于复杂,导致对测试数据预测很好,但对训练数据预测很差。(
对训练数据预测很好,对测试数据预测很差
)三、分析题(本题满分30分,共含5道小题,每小题6分)1、现有样本如下:0,2,3,4,5,6,7,8,9,10,41,42,43,44,45,46,47,48,49,50。使用等距离散化来处理该样本,将样本分为5个区间段。有几个区间内样本容量不为0?你的答案:2你的计算过程:首先,计算样本的最小值和最大值:最小值:0最大值:50然后,确定分为5个区间时的间距:(最大值
-
最小值)
区间数
=
(50
-
0)
5
=
10接下来,以间距为10进行等距离散化:区间1:0-9
(共10个样本)区间2:10-19
(无样本)区间3:20-29
(无样本)区间4:30-39
(无样本)区间5:40-50
(共11个样本)根据以上结果,有2个区间段(区间2和区间3)内的样本容量不为0。请注意,这种等距离散化方式可能导致某些区间没有样本,而其他区间样本较多。2、随机森林采用的是什么集成方法?(a.
ing,b.boos,c.stacking)。这种集成方法适用于什么情况?你的选择:ing你的解释:ing(自举汇聚法)适用于以下情况:训练数据较少,需要尽可能充分利用现有的有限样本。数据集存在较强的噪声或离群点,需要通过多个模型的平均来减小噪声影响。需要降低模型的方差,提高模型的稳定性和鲁棒性。模型复杂度较高,容易过拟合,需要引入随机性增加泛化能力。ing通过对原始训练集进行有放回的抽样,构建多个子模型。每个子模型相互独立地训练,并通过取平均值(回归问题)或投票(分类问题)的方式进行预测。随机森林就是一种基于ing思想的集成学习算法,它使用决策树作为基分类器,并通过对特征的随机选择进一步增加模型的多样性。由于ing的平行结构,随机森林可以有效处理大规模数据,具有较好的预测性能和计算效率。3、为了考察一种新的教学方法对学生英语成绩的影响,某学校进行了调查,共得到400个样本数据。数据表中grade为标签,psi、gpa、tuc为特征。grade为分类数据,取1表示学习成绩提高,0表示学习成绩没有提高;
七零娇美人,甩掉知青当首富 都市神医,开局扇醒拜金女 医林萧韵 武侠游戏:只有我知道剧情 我在修仙游戏世界中浑水摸鱼 逼我做妾?真太子为我入赘将军府 我手握无限物资,砸出末世安全区 沙雕攻以为他虐了白月光 我在无限游戏中永生 小马宝莉:星空之下 八零守寡小娇娇,冷面糙汉被钓疯 穿越明朝之我救了马皇后 京港月光 七零大厂美人,改造反派崽暴富 跌落山崖的我,习得神级功法 穿成花瓶美人,反派老公破产了 新来的转校生竟比校霸还野 快穿:盘古居然是我哥 空间通末世,我带飞全家很合理吧 凛冬末日:全民避难所求生
...
...
王虎穿越了,而且悲催的成了五指山下的一只老虎。我去,这是要做猴哥虎皮裙的节奏?王虎表示不服。作为一只21世纪穿越来的新时代老虎,怎么着也要和猴哥拜把子,做兄弟啊!此时此刻齐天大圣孙悟空被压五行山马上就满五百年,再有十年,波澜壮阔,影响三界格局的西天取经之旅就要开始,看王虎如何在其中搅动三界风云,与猴哥一起再掀万...
余庆阳一个搬砖二十年的老工程,梦回世纪之交,海河大学毕业,接老爸的班继续搬砖。用两辈子的行动告诉老师,搬砖不是因为我学习不好!是我命中注定要搬砖已有两本百万字完本书超级村主任最强退伍兵,可以放心入坑!大国工程书友群,群聊号码492691021新书重生之大国工匠...
...
甜宠无虐+日更+萌宝+智脑一个大佬和重生来的小媳妇甜蜜日常!一个娱乐小透明凭借智脑逆袭成超级影后的故事~...