当前位置:   article > 正文

手机联系人批量导入(字符编码、xlsx与vcf互转)_华为vcf模板

华为vcf模板

一、前言

单位同事每人都办理了一个192新手机号,一打过来不知道是谁,又懒的一个个保存姓名。一想是不是可以批量导入呢?电子表格号码名单我有啊,试试吧。

二、实践

1.先下载手机联系人文件看看吧。在手机联系人设置中有个导出选项(华为手机为例):

 导出文件为00001.vcf,用文本编辑强行打开,是一个个卡片:

 2.下载VCF编辑软件试试。

 这一款(A款),居然打不开vcf文件,不咋地。

 

 这一款(B款),可以读出vcf文件,只能读50个,要注册收费,麻烦;电子表格转成vcf文件后,不能正常导入手机(没有ENCODING=QUOTED-PRINTABLE转换,3.0版),不咋地。

3.折腾

问题还没解决啊(同时,还整了另外一款转换的也没弄成),在A款(名字叫VCF通讯录编辑器)手动输入2个姓名电话试试,将那个contacts.vcf文件导入手机,可以。

也就是说,只要把电子表格文件导入就解决问题了,出了意外:

 导入、导出都无法完成,什么鬼气,Excel版本问题?不管了,导出Access文件试试,可以。

Access文件类型mdb,数据库文件,启动Access2007,打开联系人那张表,把电子表格里的姓名、电话号码复制粘贴到对应字段后保存(在Access里面,通过导入xls重新生存一张新表,在VCF通讯录编辑器导入时也会出错,NND没时间研究)。

返回VCF通讯录编辑器,再通过导入Access文件,可以了,保存通讯录。

contacts.vcf文件通过微信传手机,选择联系人打开文件,点击导入VCF文件,成功。

三、思考

VCF格式文件,文本可见,应该是很单纯的,怎么这么难搞。

 这个UID要不要不影响。

 这几项(单位地址、家庭地址、公司等)也不重要。

 这个图片项,太大了,最好是不要。

这里面,除了电话号码外,最重要的一句就是这句了:N;CHARSET=UTF-8;ENCODING=QUOTED-PRINTABLE:;=E9=83=90=AF=E6=38;

quoted-printable编码

可译为“可打印字符引用编码”,在Python里操作认识一下:

  1. >>> import quopri
  2. >>> s='你好'
  3. >>> type(s)
  4. <class 'str'>
  5. >>> b=s.encode()
  6. >>> type(b)
  7. <class 'bytes'>
  8. >>> qe=quopri.encodestring(b)
  9. >>> type(qe)
  10. <class 'bytes'>
  11. >>> qe
  12. b'=E4=BD=A0=E5=A5=BD' #一个汉字转3字节utf8编码,分别用“=”分开
  13. >>> s='hello'
  14. >>> b=s.encode()
  15. >>> qe=quopri.encodestring(b)
  16. >>> qe
  17. b'hello' #ASC字符字母无变化
  18. >>> s=' ' #Tab键
  19. >>> b=s.encode()
  20. >>> qe=quopri.encodestring(b)
  21. >>> qe
  22. b'=09' #Tab键的qp码
  23. >>> s='='
  24. >>> b=s.encode()
  25. >>> qe=quopri.encodestring(b)
  26. >>> qe
  27. b'=3D' #等号的qp码
  28. >>> s=' '#空格
  29. >>> b=s.encode()
  30. >>> qe=quopri.encodestring(b)
  31. >>> qe #空格的qp码
  32. b'=20'
  33. >>> s='`~!@#$%^&*()+'#其他字符
  34. >>> b=s.encode()
  35. >>> qe=quopri.encodestring(b)
  36. >>> qe
  37. b'`~!@#$%^&*()+' #其他字符的qp码无变化
  38. >>> s='你好hello我很好=好=GOOD'
  39. >>> b=s.encode()
  40. >>> qe=quopri.encodestring(b)
  41. >>> qe
  42. b'=E4=BD=A0=E5=A5=BDhello=E6=88=91=E5=BE=88=E5=A5=BD=3D=E5=A5=BD=3DGOOD'
  43. >>> #混合字符样式qp码

字符的编码类型除了utf-8,还有(一)GB系列:

>> b=s.encode('gb2312')  >>> b
b'\xc4\xe3\xba\xc3'
>>> b=s.encode('gbk')  >>> b     #cp936好象跟GBK差不多
b'\xc4\xe3\xba\xc3'
>>> b=s.encode('gb18030')  >>> b
b'\xc4\xe3\xba\xc3' 

相关补充(来自网络):

GB2312(1980年)一共收录了7445个字符,汉字区的内码范围高字节从B0-F7,低字节从A1-FE。

1995年的汉字扩展规范GBK1.0收录了21886个符号。

2000年的 GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC平 台必须支持GB18030,对嵌入式产品暂不作要求。所以手机、MP3一般只支持GB2312。

从ASCII、 GB2312、GBK到GB18030,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码 中,英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼,GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。

(二)U系列:

>>> s='你好'
>>> b=s.encode('unicode_escape')
>>> b
b'\\u4f60\\u597d'

>>>len(b)

12                                 #一个汉字6字节

>>> b[0]
92                                #返回“\”的ascii值
>>> b[1]
117                              #返回“u”的ascii值,后面类似

>>> bin(b[1])
'0b1110101'                #字符u的ascii
>>> b[1].bit_length()
7                                 #二进制长度7 
>>> type(b[1])
<class 'int'>               #python数据类型:整数型
>>> b[1].to_bytes(1,"big")
b'u'                             #返回ascii代码

相关补充(来自网络):

Unicode 也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言文字的编码方案。Unicode的学名是"Universal Multiple-Octet Coded Character Set",简称为UCS。而Unicode只与ASCII兼容,与GB码不兼容。例如“你”字的Unicode编码是4f60,而GB码是c4e3。

UCS有两种格式:UCS-2和UCS-4。顾名思义,UCS-2就是用两个字节编码,UCS-4就是用4个字节(实际上只用了31位,最高位必须为0)编码。UCS-2有2^16=65536个码位,UCS-4有2^31=2147483648个码位。

怎样传输这些编码,是由UTF(UCS Transformation Format)规范规定的,常见的UTF规范包括UTF-8、UTF-7、UTF-16、UTF-32。

>>> b=s.encode('utf8') #默认,可省:b=s.encode()
>>> b
b'\xe4\xbd\xa0\xe5\xa5\xbd'      #utf8编码:一个汉字3字节,每字节长度为8

>>> b[0]
228
>>> b[0].bit_length()
8
>>> bin(b[0])
'0b11100100'
>>> b[0].to_bytes(1,'big')
b'\xe4'

b=s.encode('utf-16')  >>> b  #utf16编码:一个汉字4字节,两个6,三个8
b'\xff\xfe`O}Y'

>>> b=s.encode('utf-32')  >>> b  #utf32编码:一个汉字8字节,两个12,三个16
b'\xff\xfe\x00\x00`O\x00\x00}Y\x00\x00'

>>> b=s.encode('utf7')  >>> b
b'+T2BZfQ-'   #utf7编码:一个汉字5字节,两个8,三个10,四个13,,332递增型

(三)其他:

>>> s='你好'
>>> b=s.encode('big5')
>>> len(b)
4
>>> b
b'\xa7A\xa6n' 
 #BIG5编码:一个汉字2字节,长:前8后7

>>> b[0].bit_length()
8
>>> b[1].bit_length()
7

相关补充(来自网络):

UTF-8编码字节含义

  • 对于UTF-8编码中的任意字节B,如果B的第一位为0,则B独立的表示一个字符(ASCII码);
  • 如果B的第一位为1,第二位为0,则B为一个多字节字符中的一个字节(非ASCII字符);
  • 如果B的前两位为1,第三位为0,则B为两个字节表示的字符中的第一个字节;
  • 如果B的前三位为1,第四位为0,则B为三个字节表示的字符中的第一个字节;
  • 如果B的前四位为1,第五位为0,则B为四个字节表示的字符中的第一个字节;

utf-8汉字编码3字节模板了:1110xxxx 10xxxxxx 10xxxxxx。

例如“汉”字的Unicode编码是6C49。6C49在0800-FFFF之间,将6C49写成二进制是:0110 110001 001001, 用这个比特流依次代替模板中的x,得到:11100110 10110001 10001001,即E6 B1 89。三字节编码从“E”开始。

四、代码实现

1.先来个操作界面。就用TKinter。

 部分代码如下:

  1. from tkinter import *
  2. from tkinter import filedialog
  3. import os
  4. import openpyxl
  5. root= Tk()
  6. root.title('电子表格转vcf(qq:35386940)')
  7. root.geometry('640x500') # 这里的乘号不是 * ,而是小写英文字母 x
  8. root.resizable(False,False)#固定窗口大小
  9. def run_xls2vcf():
  10. pass
  11. return
  12. #添加按钮
  13. btn21 = Button(root, text='xlsx → vcf', command=run_xls2vcf)#添加按钮
  14. btn21.place(relx=0.7, rely=0.05, relwidth=0.2, relheight=0.1)#放置位子:百分比
  15. #设置文本框
  16. txt=Text(root)#设置文本框
  17. txt.insert('end','Hello!(Ctrl+C复制)')
  18. txt.pack(padx=3,pady=103)#边缘点距
  19. root.mainloop()

上面这个太LOW了,经过不断完善,最后弄成了下面的样子:

 操作界面代码:

  1. #1添加按钮
  2. #按钮1
  3. btn1 = Button(root, text='读取表格文件', command=read_xlsx)#命令指向自定义名
  4. btn1.place(x=3, y=333, width=120, height=64)#放置位子大小;(relx=0.1, rely=0.85, relwidth=0.18, relheight=0.1)#百分比
  5. #按钮2
  6. btn2 = Button(root, text='读取vcf文件', command=read_vcf)#命令指向自定义名
  7. btn2.place(x=126, y=333, width=120, height=64)#放置位子大小;
  8. #按钮3
  9. btn3 = Button(root, text='保存为表格文件', command=write_xlsx)#命令指向自定义名
  10. btn3.place(x=249, y=333, width=120, height=64)#放置位子大小;
  11. #按钮4
  12. btn4 = Button(root, text='保存为vcf文件\n\n(GBK编码)', command=write_vcf_unicode)#命令指向自定义名
  13. btn4.place(x=372, y=333, width=120, height=64)#放置位子大小;
  14. #按钮5
  15. btn4 = Button(root, text='保存为vcf文件\n\n(UTF-8编码)', command=write_vcf_utf8)#命令指向自定义名
  16. btn4.place(x=495, y=333, width=120, height=64)#放置位子大小;
  17. #2.1设置一个框架容器
  18. frame = Frame(root)
  19. frame.place(x=3, y=3, width=634, height=303)#放置坐标大小
  20. #2.2容器内添加滚动条并绑定
  21. scrollBar=Scrollbar(frame) #框架里设置
  22. #绑定
  23. scrollBar.pack(side=RIGHT, fill=Y)#靠右,y方向填满
  24. #2.3容器内添加Treeview组件,列,显示表头(不显示tree结构),带垂直滚动条,然后设置并绑定
  25. tree_date =ttk.Treeview(frame,columns=('no','name','phone1','phone2','address'),show="headings",yscrollcommand=scrollBar.set)
  26. # 设置列宽度
  27. tree_date.column('no',width=40,anchor='se') #右对齐
  28. tree_date.column('name',width=100,anchor='center')#中心对齐
  29. tree_date.column('phone1',width=120,anchor='center')
  30. tree_date.column('phone2',width=120,anchor='center')
  31. tree_date.column('address',width=228)
  32. # 添加列名
  33. tree_date.heading('no',text='序号')
  34. tree_date.heading('name',text='姓名')
  35. tree_date.heading('phone1',text='电话号码1')
  36. tree_date.heading('phone2',text='电话号码2')
  37. tree_date.heading('address',text='地址')
  38. #绑定
  39. tree_date.pack(side=LEFT, fill=Y)
  40. #2.4滚动条与树型数据捆绑
  41. scrollBar.config(command=tree_date.yview)
  42. #tree_date.clipboard_clear()
  43. #2.5添加数据
  44. # for i in range(1,30):
  45. # tree_date.insert('',i,text=i,values=(i,'熊大好','13412345678','22222345678','湖北荆州沙市九龙湾'))
  46. #增加一个红色状态文字标签
  47. lbl=Label(root,textvariable=strs,foreground='red')
  48. lbl.place(x=13,y=309)
  49. root.mainloop()

2.读取xlsx文件

电子表格读取,分两种格式,xls和xlsx,本例只读xlsx。

  1. def read_xlsx():
  2. tree_date.delete(*tree_date.get_children())#清空前一次读数
  3. filename = filedialog.askopenfile(title=u'选择xlsx文件',initialdir=(os.path.expanduser('d:/')))#打开文件对话框
  4. if filename:
  5. #print(filename.name)
  6. if filename.name.split('.')[-1].lower() not in ['xlsx']:
  7. #txt.insert('end','\n\n'+filename.name+u'不是表格文件!')
  8. print('非电子表格文件。')
  9. strs.set('*提示:'+filename.name+'不是xlsx文件!')
  10. return
  11. xlsx=openpyxl.load_workbook(filename.name) #读取表格文件
  12. sheet1=xlsx.worksheets[0] #读取第一个表
  13. n=sheet1.max_row #最大行
  14. m=sheet1.max_column #最大列
  15. #print('读到表格文件',filename.name,n,':行;',m,'列')
  16. strs.set('*提示:读到表格文件'+filename.name+',有'+str(n)+'行;'+str(m)+'列')
  17. global fold,lst #传递全局参数
  18. fold=filename.name
  19. lst=[]#全局数据
  20. one=[]#临时数据
  21. for i in range(1,n+1):#取出表格数据,显示并加入列表
  22. for j in range(1,m+1):
  23. if sheet1.cell(i,j).value is not None :
  24. one.append(sheet1.cell(i,j).value)
  25. else:
  26. one.append('')
  27. if i==1 and len(one)>3:#如果是第一行,判断电话号码有没5位数字,没有则当作标题
  28. n_sum=0
  29. for k in one[2]:
  30. if k>='0' and k<='9':
  31. n_sum=n_sum+1
  32. if n_sum<=5:
  33. one.clear()
  34. else:
  35. lst.append(one.copy())
  36. tree_date.insert('',n,text='',values=one) #显示到列表
  37. one.clear()
  38. return lst,fold

为了读取更准确高效,提示固定了表格分栏:1序号,2姓名,3和4电话号码,5地址。标题栏进行了简单判断,设置了2个全局变量,文件名、读取到的内容。

3.读取VCF文件

  1. def read_vcf():
  2. tree_date.delete(*tree_date.get_children())#清空前一次读数
  3. filename = filedialog.askopenfile(title=u'选择vcf文件',initialdir=(os.path.expanduser('d:/')))#打开文件对话框
  4. #print(filename.name)
  5. global fold,lst
  6. fold=filename.name
  7. f_r=open(filename.name,'rb')#读取二进制文件
  8. f_io=BytesIO()#内存文件缓存
  9. quopri.decode(f_r,f_io)#直接解码文件到内存
  10. f_io.seek(0,0) #这个很重要,指针归零,否则只能getvalue,不能readline,文件操作也一样,读一遍后指针在文末,第二次操作要归零
  11. lines=f_io.readlines()#读取所有的行
  12. print('读到vcf文件',filename.name,len(lines),'行')
  13. lst=[]
  14. #lst.clear()#实际是个二维表
  15. one=[]
  16. n=0
  17. for i in lines:
  18. #print(i)
  19. if b'BEGIN:' in i:#判断是否为开始标识,是则添加行号
  20. n=n+1
  21. one.append(n)
  22. #print(one)
  23. continue #忽视下面的语句,直接下一行
  24. if b'N;CHAR'==i[:6]:
  25. st=i.decode().split(':')[1][:-2].replace(';','')
  26. if len(st)!=0:#是否有姓氏,有则添加姓
  27. one.append(st)
  28. else:
  29. one.append('')#没有添加空字符
  30. continue
  31. if b'FN;CHA'==i[:6]:
  32. st=i.decode().split(':')[1][:-2]
  33. #print(st,one)
  34. if st!=one[1]: #姓和名是否相同,不同则合在一起
  35. one[1]=one[1]+st
  36. continue
  37. if b'TEL'==i[:3]:
  38. st=i.decode().split(':')[1][:-2].replace(' ','')#取出电话号码,消除空格
  39. one.append(st)
  40. continue
  41. if b'ADR'==i[:3]:#取出地址信息,放在第4列位子
  42. st=i.decode().split(':')[1][:-2].replace(';','')
  43. if len(one)==4:
  44. one.append(st)
  45. else:
  46. one.append('')
  47. one.append(st)
  48. continue
  49. if b'END:VC'==i[:6]:
  50. lst.append(one.copy())#需要拷贝进去,否则one清除时,lst数据也清除了
  51. #print(one,'加入列表',len(lst))
  52. tree_date.insert('',n,text='',values=one) #显示到列表
  53. one.clear()
  54. #print(one,'加入列表',lst[0],len(lst))
  55. print(len(lst),'条记录生存。')
  56. strs.set('提示:读到vcf文件'+filename.name+',有'+str(len(lines))+'行,'+str(len(lst))+'条记录。')
  57. return fold,lst

以字节方式读取vcf文件,直接用quopri.decode(f_r,f_o)解码转成内存文件,再读取所有的行,最后进行“行识别”,整理成列表返回。

4.保存为xlsx文件

  1. def write_xlsx():
  2. # 创建一个Workbook对象
  3. #print(fold,'??',len(lst),lst[0])
  4. fn=fold.split('.')[0]+'_1.xlsx'
  5. #print(fn)
  6. wb = openpyxl.Workbook()#创建工作本对象(类)
  7. sh=wb.create_sheet(index=0, title="电话本")#指定为第一个
  8. sh['A1']='序号'
  9. sh['B1']='姓名'
  10. sh['C1']='电话号码1'
  11. sh['D1']='电话号码2'
  12. sh['E1']='地址'
  13. for i in lst:
  14. sh.append(i)
  15. #print(i)
  16. wb.save(fn)#保存文件
  17. strs.set('提示:文件'+fn+'已写入。')
  18. os.startfile(fn) #默认打开
  19. return

写入xlsx文件,位子在打开文件同目录,并默认打开。

5.保存为vcf文件

  1. def write_vcf_gbk():
  2. fn=fold.split('.')[0]+'_1.vcf'
  3. n=len(lst)
  4. print(fn,',长度:',n)
  5. b=b''
  6. # b'BEGIN:VCARD\r\n', b'VERSION:2.1\r\n',
  7. # b'N;CHARSET=UTF-8;ENCODING=QUOTED-PRINTABLE:;\xe5\xbc\xa0;;;\r\n',
  8. # b'FN;CHARSET=UTF-8;ENCODING=QUOTED-PRINTABLE:\xe5\xbc\xa0\r\n',
  9. # b'TEL;CELL:136 2717 7377\r\n',
  10. # ADR;HOME;CHARSET=UTF-8;ENCODING=QUOTED-PRINTABLE:;;=E6=B7=B1;;;;
  11. # b'END:VCARD\r\n'
  12. for i in lst:
  13. m=len(i)
  14. b=b+b'BEGIN:VCARD\r\nVERSION:2.1\r\n'
  15. if m>1 and i[1]:
  16. name_qp=quopri.encodestring(i[1].encode())
  17. b=b+b'N;CHARSET=UTF-8;ENCODING=QUOTED-PRINTABLE:;'+name_qp+b';;;\r\n'
  18. b=b+b'FN;CHARSET=UTF-8;ENCODING=QUOTED-PRINTABLE:'+name_qp+b'\r\n'
  19. if m>2 and i[2] :
  20. no_qp='TEL;CELL:'+(str(i[2]))+'\r\n'
  21. b=b+no_qp.encode()
  22. if m>3 and i[3]:
  23. no_qp='TEL;CELL:'+(str(i[3]))+'\r\n'
  24. b=b+no_qp.encode()
  25. if m>4 and i[4]:
  26. adr_qp=quopri.encodestring(i[4].encode())
  27. b=b+b'ADR;HOME;CHARSET=UTF-8;ENCODING=QUOTED-PRINTABLE:;;'+adr_qp+b';;;;\r\n'
  28. b=b+b'END:VCARD\r\n'
  29. fs=open(fn,'w',encoding='gbk')#默认是UTF8,转成unicode,不然低于50条记录,华为手机不认
  30. fs.write(b.decode())#字节先还原成Utf8字符,再转Uni后写入文件
  31. strs.set('提示:文件'+fn+'已写入。')
  32. print('已写入文件:',fn)
  33. return
  34. def write_vcf_utf8():
  35. fn=fold.split('.')[0]+'_2.vcf'
  36. n=len(lst)
  37. print(fn,',长度:',n)
  38. b=b''
  39. for i in lst:
  40. m=len(i)
  41. b=b+b'BEGIN:VCARD\r\nVERSION:2.1\r\n'
  42. if m>1 and i[1]:
  43. name_qp=quopri.encodestring(i[1].encode())
  44. b=b+b'N;CHARSET=UTF-8;ENCODING=QUOTED-PRINTABLE:;'+name_qp+b';;;\r\n'
  45. b=b+b'FN;CHARSET=UTF-8;ENCODING=QUOTED-PRINTABLE:'+name_qp+b'\r\n'
  46. if m>2 and i[2] :
  47. no_qp='TEL;CELL:'+(str(i[2]))+'\r\n'
  48. b=b+no_qp.encode()
  49. if m>3 and i[3]:
  50. no_qp='TEL;CELL:'+(str(i[3]))+'\r\n'
  51. b=b+no_qp.encode()
  52. if m>4 and i[4]:
  53. adr_qp=quopri.encodestring(i[4].encode())
  54. b=b+b'ADR;HOME;CHARSET=UTF-8;ENCODING=QUOTED-PRINTABLE:;;'+adr_qp+b';;;;\r\n'
  55. b=b+b'END:VCARD\r\n'
  56. fs=open(fn,'wb')#默认是UTF8,二进制直接写
  57. fs.write(b)
  58. #print('已写入文件:',fn)
  59. strs.set('提示:文件'+fn+'已写入。')
  60. return

考虑到可能存在不同手机的要求,打包文件时采取了2种编码格式:gbk和uft8,姓名地址分别用quopri.encodestring(str_s.encode())进行了转换。

实测

如出现:,有可能已经导入成功,如没有导入,换一种编码试试。

有了这个工具,可以把手机电话本全部导出,转成电子表格整理一下,然后再导回手机。 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/270922
推荐阅读
相关标签
  

闽ICP备14008679号