监督学习是指利用已经标注了正确答案的数据来训练模型,从而对新的数据进行分类或回归的任务,例如手写数字识别、房价预测等 - 监督学习的常用算法有线性回归、逻辑回归、支持向量机、决策树、随机森林、神经网络等 - 监督学习的评估指标有准确率、精确率、召回率、F1值、均方误差等
无监督学习是指利用没有标注正确答案的数据来训练模型,从而发现数据中的隐藏结构或模式的任务,例如聚类、降维、异常检测等
无监督学习的常用算法有K均值、主成分分析、自编码器、生成对抗网络等
无监督学习的评估指标有轮廓系数、信息熵、互信息等
半监督学习是指利用部分标注了正确答案的数据和大量没有标注正确答案的数据来训练模型,从而提高模型的泛化能力和准确性的任务,例如图像分类、文本分类等
半监督学习的常用算法有自训练、协同训练、标签传播等
半监督学习的评估指标与监督学习类似,但需要考虑未标注数据的影响
强化学习是指让计算机在与环境交互的过程中,通过不断地尝试和反馈,学习到最优的行为策略的任务,例如下棋、玩游戏、控制机器人等
强化学习的常用算法有Q学习、SARSA、策略梯度、深度Q网络等
强化学习的评估指标有累积奖励、平均奖励等