假设我有两个DataFrame
:XA
和XB
,每个都有3行2列:
import pandas as pd
XA = pd.DataFrame({
'x1': [1, 2, 3],
'x2': [4, 5, 6]
})
XB = pd.DataFrame({
'x1': [8, 7, 6],
'x2': [5, 4, 3]
})
对于XA
中的每条记录,我希望在XB
中找到最近的记录(例如,基于欧几里德距离),以及相应的距离。例如,这可能会返回一个在id_A
上索引的DataFrame
,以及id_B
和distance
的列。
我怎样才能最有效地做到这一点呢?
转载请注明出处:http://www.starkdigitech.com/article/20230526/1545272.html