网站搜索
管理 Python 项目、运行脚本和工具、处理依赖项以及安装包——所有这些都可以使用 uv 工具完成。
uv 是一个快速的 Python 包和项目管理器,用 Rust 编写。它可以用来代替 pip、pip-tools、pipx、poetry、pyenv 和 virtualenv 工具。 uv 提供了一个用于管理 Python 项目的完整生态系统,允许您添加依赖项、管理工具、运行脚本等等。简而言之,从安装 Python 到构建 Python 应用程序,uv 使这个过程变得更快、更容易。 uv 的最佳功能之一是它与 pip 工具的兼容性。这意味着您只需在命
阅读更多 →当您构建预测模型时,您需要一种方法来评估模型对未见数据的能力。
这通常是通过使用未用于训练模型的数据(例如测试集)或使用交叉验证来估计准确性来完成的。 R 中的插入符包提供了多种方法来估计机器学习算法的准确性。
在这篇文章中,您将发现 5 种针对未见过的数据评估模型性能的方法。您还可以使用每种方法的插入符包来访问 R 中的配方,您现在可以将其复制并粘贴到您自己的项目中。
使用我的新书《Machine Learning Mastery With R》启动您的项目,其中包括分步教程和R 源代码文件所有的例子。
让我们开始吧。
阅读更多 →用于统计计算的 R 平台可能是最流行、最强大的应用机器学习平台。
R 中的插入符号包被称为“R 的竞争优势”。它使 R 中的机器学习模型的训练、调整和评估过程变得一致、简单甚至有趣。
在这篇文章中,您将发现 R 中的插入符包、它的关键功能以及去哪里了解更多信息。
使用我的新书《Machine Learning Mastery With R》启动您的项目,其中包括分步教程和R 源代码文件所有的例子。
让我们开始吧。
阅读更多 →R 中的插入符包旨在简化应用机器学习的过程。
解决数据问题的关键在于理解现有数据。您可以通过数据可视化总结属性来快速完成此操作。
R 中有很多用于汇总数据的包和函数,让人感觉不知所措。出于应用机器学习的目的,caret 包提供了一些关键工具,可以帮助您快速总结数据。
在这篇文章中,您将发现 caret R 包中可用的数据可视化工具。
使用我的新书《Machine Learning Mastery With R》启动您的项目,其中包括分步教程和R 源代码文件所有的例子。
让我们开始吧。
caret 包主要用于简化模型训练、估计模型性能和调整。它还具有许多方便的数据可视化工具,可以快速让您了解正在使用的数据。
在这篇文章中,我们将研究以下 4 种数据可视化:
机器学习算法被参数化,以便它们能够最好地适应给定的问题。困难在于,为给定问题配置算法本身就是一个项目。
就像为问题选择“最佳”算法一样,您无法事先知道哪些算法参数最适合问题。最好的办法是通过对照实验进行实证研究。
caret R 包的设计目的是让找到算法的最佳参数变得非常容易。它提供了一种用于搜索参数的网格搜索方法,并结合了用于估计给定模型性能的各种方法。
在这篇文章中,您将发现 5 个秘诀,您可以使用它们来调整机器学习算法,以使用插入符 R 包找到问题的最佳参数。
使用我的新书《Machine Learning Mastery With R》启动您的项目,其中包括分步教程和R 源代码文件所有的例子。
让我们开始吧。
caret R 包提供了网格搜索,您可以在其中指定参数来尝试解决您的问题。它将尝试所有组合并找到能提供最佳结果的一种组合。
本文中
阅读更多 →在数据中选择正确的特征可能意味着较长训练时间的平庸表现和较短训练时间的出色表现之间的差异。
caret R 包提供了自动报告数据中属性的相关性和重要性的工具,甚至可以为您选择最重要的特征。
在这篇文章中,您将发现 Caret R 包中的特征选择工具以及 R 中的独立配方。
读完这篇文章你会知道:
使用我的新书《Machine Learning Mastery With R》启动您的项目,其中包括分步教程和R 源代码文件所有的例子。
让我们开始吧。
阅读更多 →Caret R 包允许您轻松构建许多不同的模型类型并调整其参数。
创建和调整许多模型类型后,您可能想了解并选择最佳模型,以便可以使用它进行预测(也许在操作环境中)。
在这篇文章中,您将了解如何使用 caret R 包比较多个模型的结果。
使用我的新书《Machine Learning Mastery With R》启动您的项目,其中包括分步教程和R 源代码文件所有的例子。
让我们开始吧。
在解决问题时,您将选择一个或几个性能良好的模型。调整每个模型的参数后,您将需要比较模型并发现哪些模型表现最好和最差。
了解模型的传播情况很有用,也许可以改进模型,或者您可以停止研究性能明显比其他模型差的模型。
在下面的示例中,我们比较了皮马印第安人糖尿病数据集中的三个复杂的机器学习模型。该数据集是一系列医疗报告的摘要,表明患者五年内患糖尿病的情况。
阅读更多 →本文讨论了地理空间分析的重要性,并介绍了五个基本的 Python 包,用于有效处理和可视化地理空间数据中的有价值的见解。
适用于:点云
Folium 是一个 Python 库,用于创建带有标记、弹出窗口、分区统计图和其他地理空间可视化的交互式地图。它与 Leaflet JavaScript
阅读更多 →