1. <optgroup id="o3fot"></optgroup>
    <big id="o3fot"></big>
  2. <label id="o3fot"></label>
  3. 教育行業A股IPO第一股(股票代碼 003032)

    全國咨詢/投訴熱線:400-618-4000

    Python培訓之數據預處理:通過duplicated()方法處理重復值

    更新時間:2022年07月11日13時57分 來源:傳智教育 瀏覽次數:

    好口碑IT培訓

      duplicated()方法的語法格式如下:

      上述方法中參數的含義如下:

      (1)subset:用于識別重復的列標簽或列標簽序列,默認識別所有的列標簽。

      (2)keep:刪除重復項并保留第一次出現的項,取值可以為first、last或False,它們代表的含義如下:

      (1)first:從前向后查找,除了第一次出現外,其余相同的被標記為重復。默認為此選項。

      (2)last:從后向前查找,除了最后一次出現外,其余相同的被標記為重復。

      (3)False:所有的相同的都被標記為重復。

      duplicated()方法用于標記Pandas對象的數據是否重復,重復則標記為True,不重復則標記為False,所以該方法返回一個由布爾值組成的Series對象,它的行索引保持不變,數據則變為標記的布爾值。

      注意:對于duplicated()方法,這里有如下兩點要進行強調:

      第一,只有數據表中兩個條目間所有列的內容都相等時,duplicated()方法才會判斷為重復值。除此之外,duplicated()方法也可以單獨對某一列進行重復值判斷。

      第二,duplicated()方法支持從前向后(first)和從后向前(last)兩種重復值查找模式,默認是從前向后查找判斷重復值的。換句話說,就是將后出現的相同條目判斷為重復值。

    0 分享到: