剪枝是指移除预测能力较弱的分支,以降低模型的复杂度,并提高决策树模型的预测准确性。剪枝有多种形式,包括自下而上和自上而下的剪枝,以及减少误差剪枝和降低成本复杂度剪枝等方法。
您认为哪一个更重要:模型准确性还是模型性能?
模型性能的掌握,并且通常会关注细节。有些模型准确率更高,但预测能力却可能更差,这怎么解释呢?
嗯,这与模型准确率 电话号码数据库 只是模型性能的一个子集,而且有时还会具有误导性息息相关。例如,如果你想在包含数百万样本的海量数据集中检测欺诈行为,一个更准确的模型很可能会在只有极少数案例是欺诈的情况下预测出根本不存在欺诈行为。然而,这对于预测模型来说毫无意义——一个旨在发现欺诈行为却断言根本不存在欺诈行为的模型!这类问题可以帮助你证明你理解模型准确率并非模型性能的全部。
F1 分数是多少?
它是衡量模型性能的指标。更确切地说,它是模型准确率和召回率的加权平均值,其中 1 表示最佳,0 表示最差。
什么时候应该使用分类而不是回归?
分类和回归的含义不同。分类产生的是离散值,而回归产生的是连续值。例如,当你想知道一个名字是男 则在使用支付系统和在线性还是女性,而不是仅仅想知道它与男性和女性名字的相关性时,你会使用分类而不是回归。
什么是凸包?
凸包表示两组数据点的外边界。一旦创建了凸包,我们就会得到最大间隔超平面 (MMH),它试图在两组数据点之间建立最大的分离,作为两个凸包之间的垂直平分线。
一般问题
您有机器学习方面的研究经验吗?
机器学习正在兴 邮寄线索起,没有人愿意让新手加入团队。大多数招聘机器学习职位的雇主都会看重你在该领域的经验。由该领域的领军人物共同撰写或指导的研究论文,可以让你脱颖而出。确保你准备好过去几年所做工作的总结和论证。
你最近读过的机器学习论文有哪些?你认为这些论文为什么重要?
由于这个领域日新月异,紧跟最新的科学文献至关重要,这能表明你真的对机器学习感兴趣,而不是仅仅因为它是最新的流行词。一些不错的入门书籍包括 Ian Goodfellow 的《