|
Post by arzina666 on Nov 8, 2023 3:28:46 GMT
样打印列很可能只会向我们显示空值而不是该列应保存的实际数据。执行此代码的输出如下。巷子列中的值表示砾石或铺砌的路面打印到终端您可以看到小巷列包含描述小巷类型铺砌的小巷砾石小巷等的字符串。现在您可以使用方法为与此上下文匹配的任何缺失数据添加占位符值在这里您调用来查看中标记为的列并使用字符串覆盖任何空值以指示此属性上没有巷子。改现有还是创建副本。通过将其设置为您将在原始的上运行。由于该操作特定于列因此您可以使用索引运算符访问该列以使用打印快速快照输出如下。五行显示否打印到终端看来方法按预期执行。您可以使用和确认下的每一行现在都有一个值由于将范围缩小到列会返回一个而不。 是完整的因此您只需调用在之后使用一次生成列中每次出现的计数列中的值显示打印到终端您可以看到和方法总共返回了行包含数据这与的基本形状相匹配。为什么这很重要如果您所做 哥斯达黎加手机号码列表 的只是添加一个值来表示没有巷子为什么不将其留空呢回填缺失数据的优点是现在很清楚这些单元格不是偶然为空的。您明确指出这些属性中的每一个都没有界限并用意向性取代了歧义。当然添加占位符数据的缺点是您之前围绕缺少数据的列执行的计算将不再起作用。不关心单元格中的实际值是什么只关心它们是否为空。 当然您可以使用其他和方法根据列中的数据是否与字符串匹配来过滤数据但这将是一个比简单地在上调用更复杂的过程。为了实现两全其美您可以重新设计之前的工作流程以便创建的副本来运行保留原始的值以供参考同时创建更明确的来执行分析过滤掉缺失数据行还是回填它们更好取决于您的目标和您正在执行的分析的范围。使用方法来增强数据清理并提高数据质量。您需要良好的数据才能做出正确的决策。然而数据通常需要检查和清理才能。
|
|