python numpy中setdiff1d的用法說明
setdiff1d(ar1, ar2, assume_unique=False)
1.功能:找到2個數組中集合元素的差異。
2.返回值:在ar1中但不在ar2中的已排序的唯一值。
3.參數:
ar1:array_like 輸入數組。
ar2:array_like 輸入比較數組。
assume_unique:bool。如果為True,則假定輸入數組是唯一的,即可以加快計算速度。 默認值為False。
二、具體示例1.assume_unique = False的情況:a = np.array([1,2,3]) b = np.array([4,5,6]) c = np.setdiff1d(a, b) print(c)#[1 2 3] a = np.array([1,2,3]) b = np.array([1,2,3]) c = np.setdiff1d(a, b) print(c)#[] a = np.array([1,2,3]) b = np.array([2,3,4]) c = np.setdiff1d(a, b) print(c)#[1] a = np.array([1,2,3,4]) b = np.array([3,4,5,6]) c = np.setdiff1d(a, b) print(c)#[1 2] a = np.array([1,2,3,2,4,1]) b = np.array([3,4,5,6]) c = np.setdiff1d(a, b) print(c)#[1 2] a = np.array([8,2,3,2,4,1]) b = np.array([7,4,5,6,3]) c = np.setdiff1d(a, b) print(c)#[1 2 8]
可以從最后看出返回的值從小到大排序,并且唯一。(8在a的第1位,2在a中重復了2次)
2.assume_unique = True的情況:a = np.array([3,2,1]) b = np.array([4,5,6]) c = np.setdiff1d(a, b,True) print(c)#[3 2 1] a = np.array([8,2,3,2,4,1]) b = np.array([7,4,5,6,3]) c = np.setdiff1d(a, b,True) print(c)#[8 2 2 1] a = np.array([8,2,3,4,2,4,1]) b = np.array([7,9,5,6,3]) c = np.setdiff1d(a, b,True) print(c)#[8 2 4 2 4 1]
可以看出把在a中的但是不在b中的元素按a中的順序排序,并且不合并重復的元素,即假定輸入數組也是唯一的,因此相比于False確實提升了運算速度。
三、整體代碼import numpy as np def main(): a = np.array([1,2,3]) b = np.array([4,5,6]) c = np.setdiff1d(a, b) print(c)#[1 2 3] a = np.array([1,2,3]) b = np.array([1,2,3]) c = np.setdiff1d(a, b) print(c)#[] a = np.array([1,2,3]) b = np.array([2,3,4]) c = np.setdiff1d(a, b) print(c)#[1] a = np.array([1,2,3,4]) b = np.array([3,4,5,6]) c = np.setdiff1d(a, b) print(c)#[1 2] a = np.array([1,2,3,2,4,1]) b = np.array([3,4,5,6]) c = np.setdiff1d(a, b) print(c)#[1 2] a = np.array([8,2,3,2,4,1]) b = np.array([7,4,5,6,3]) c = np.setdiff1d(a, b) print(c)#[1 2 8] a = np.array([3,2,1]) b = np.array([4,5,6]) c = np.setdiff1d(a, b,True) print(c)#[3 2 1] a = np.array([8,2,3,2,4,1]) b = np.array([7,4,5,6,3]) c = np.setdiff1d(a, b,True) print(c)#[8 2 2 1] a = np.array([8,2,3,4,2,4,1]) b = np.array([7,9,5,6,3]) c = np.setdiff1d(a, b,True) print(c)#[8 2 4 2 4 1] if __name__ == ’__main__’: main()
補充:Python編程之numpy庫函數in1d的使用
最近利用Python作數值分析時使用到numpy庫下的in1d函數。in1d函數與excel中vlookup函數和MATLAB中ismember函數有相似之處。其作用在于在序列B中尋找與序列A相同的值,并返回一邏輯值(True,False)或邏輯值構成的向量。
具體例子見下文設mask為邏輯值向量,矩陣x的第一列為待查找向量,d為被查詢向量(或值),即查找x中與d中指定元素相同的值,并返回邏輯值向量mask。mask是由一系列True和False值構成,True代表找到相同的值,而False代表沒找到相同的值。演示如下:
mask= np.in1d(x.values[:,1],d[1],invert=False) ##x為DataFrame型數據,x.values[:,1]表示取第二列值x_temp=x[mask]
示取第二列值
x_temp=x[mask]
該例旨在查找 x 的第二列值中與d向量中第二個元素相同的部分 ,并返回mask邏輯向量;然后x_temp返回x中mask邏輯值為True的行。
mask向量的類型為bool,查看具體值下圖所示:
值得注意的地方在于in1d函數中invert參數的設置。當invert=True時,mask中的元素值為True的部分對x.values[:,1]中與當前查找的元素d[i]不同的部分(i為當前查找位置),相同的部分則為false;當invert=False時,mask中的元素值為True的部分對x.values[:,1]中與當前查找的元素d[i]相同的部分(i為當前查找位置)。
演示見下圖:
當mask= np.in1d(x.values[:,1],d[2],invert=True)
當mask= np.in1d(x.values[:,1],d[2],invert=False)時
以上為個人經驗,希望能給大家一個參考,也希望大家多多支持好吧啦網。如有錯誤或未考慮完全的地方,望不吝賜教。
相關文章:
