目录
  • 1.merge参数概览
  • 2.左右内外连接概念讲解
    • (1)左连接
    • (2)右连接
    • (3)内连接
    • (4)外连接
  • 3.merge数据合并
    • (1)当两个表用来做连接键的列名都相同时(以左连接为例)
    • (2)当两个表用来做连接键的列名都不相同时(本次默认内连接)
  • 总结

    数据合并与重塑有merge,join,concat三种方法,本文先对merge进行讲解

    1.merge参数概览

    参数 介绍
    how 连接方式(左连接left,右连接right,内连接inner,外连接outer)默认内连接
    on 用来做连接键的列名(两表必须相同)
    left_on 左表用来做连接键的列名
    right_on 右表用来做连接键的列名
    left_index True表示左表索引列作为连接键
    right_index True表示右表索引列作为连接键
    suffix 给两表的列加后缀进行区分

    2.左右内外连接概念讲解

    pandas中的左右内外连接和mysql中的大致相同,学过mysql的更容易理解

    现在有两张表:表1和表2

    (1)左连接

    以表1为准,

    将表2中与表1能根据连接键对应的数据与表1合并,和表1对应不上的数据则丢弃

    在此过程中表1的数据是被完全保留下的

    (2)右连接

    与左连接相反,以表2为准

    将表1中与表2能根据连接键对应的数据与表2合并,和表2对应不上的数据则丢弃

    在此过程中表2的数据是被完全保留下的

    (3)内连接

    将表1和表2中根据连接键对应两边都有的数据合并

    在此过程中表1只保留了能和表2对应的数据,表2也只保留下了能和表1对应的数据,有点类似于数学中的交集

    (4)外连接

    表1和表2的数据根据连接键对应合并

    在此过程中表1表2的数据全都保留下来,相当于数学中的并集

    3.merge数据合并

    首先将两个表的数据进行读取

    import pandas as pd
    adress1="D:/pandas练习文件/merge1.xlsx"
    adress2="D:/pandas练习文件/merge2.xlsx"
    data1=pd.read_excel(adress1)
    data2=pd.read_excel(adress2)

    (1)当两个表用来做连接键的列名都相同时(以左连接为例)

    A使用方法:

    pd.merge(数据1,数据2,on=" ",how=" ")

    all_data=pd.merge(data1,data2,on="姓名",how="left")

    B数据合并前后对比:

    pandas数据合并与重塑之merge详解

    pandas数据合并与重塑之merge详解

    (2)当两个表用来做连接键的列名都不相同时(本次默认内连接)

    A使用方法

    pd.merge(数据1,数据2,left_on="",right_on="")

    all_data=pd.merge(data1,data2,left_on="姓名1",right_on="姓名2")

    B数据合并前后对比

    pandas数据合并与重塑之merge详解

    pandas数据合并与重塑之merge详解

    总结

    以上为个人经验,希望能给大家一个参考,也希望大家多多支持。

    声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。