不要以为这是高级的东西,面知道你是否掌握了所有基础知识并且处于顶尖水平。
I 类错误是假阳性,而 II 类错误是假阴性。这类错误是指声称某事已经发生,但实际上并没有发生。例如,告诉一个男人他怀孕了。另一方面,II 类错误是指你声称什么都没发生,但实际上发生了一些事情。举个例子,你告诉一位怀孕的女士她没有怀孕。
概率和可能性有什么区别?
不深入探讨技术层面,概率量化了对结果的预测,而似然度量化了对模型的信任。例如,有人挑战我们玩一场“有利可图的赌博游戏”。然后,概率可以帮助我们计算诸如预期收益和损失之类的数据。相反,似然度可以帮助我们量化我们是否首先信任这些概率,或者我们是 如果您的连接速度较慢 否察觉到了什么异常。
深度学习到底是什么?
大多数人不知道,机器学习和深度学习并非两码事,但深度学习是机器学习的一个子集。它主要研究神经网络:如何利用反向传播和其他神经科学的原理来更准确地建模大量未标记数 顶级电子邮件列表 据。简而言之,深度学习是一种无监督学习算法,主要通过神经网络来学习数据表征。探索一些关于神经网络的知识,以便有效地回答深度学习面试问题。
生成模型和判别模型有什么区别?
判别模型会学习不同类别数据之间的区别,而生成模型则会学习数据的类别。判别模型在分类任务上的表现将显著优于生成模型。
什么是时间序列分析/预测?
机器学习数据集是一系列观察结果的集合。例如,
- 观察1
- 观察2
- 观察3
但是,时间序列数据集有所不同。时间序列在观测值之间添加了明确的顺序依赖关系:时间维度。这个额外的维度既是一种约束,也是一种提供额外信息来源的结构。
- 时间 1,观察
- 时间2,观察
- 时间 3,观察
您将如何处理不平衡的数据集?
例如,不平衡数 邮寄线索据是指 90% 的数据属于某一类,而 10% 的数据属于另一类。这会导致一些问题,例如,对另一类数据没有预测能力。以下是一些解决此问题的技巧:
- 显然收集更多数据来平衡
- 尝试不同的算法(不会有效)
- 纠正数据集的不平衡