首页 > 开发 > Python > 正文

解决iana上获取顶级域名的非英文

2016-07-25 21:49:46  来源:慕课网
最近在实现一个学习顶级域名的东西,首先第一步肯定是获取顶级域名列表。  获取顶级域名列表我知道的方式有两个,一个是从iana上爬取顶级域名列表。另一个是通过根区文件里分析出顶级域名列表,由于前边学习了有一个现成的爬取的程序,就直接用了第一个,第一个的问题有一点就是里边好多非英文的域名直接dig是查不到结果的。所以要转换成相应的punycode格式。
我是用的python编写的程序,这里可以直接通过python的编码来转换,我试过只要在前边加上xn--就可以。完成了之后才发现原来在iana的那页上有一个链接链接的最后就是可以dig的域名的名称从那里直接截取字符串就是最好的解决办法。