Feb
25
今天,在小范的帮忙下。终于完成了备案检查的shell脚本。可以实现批处理进行域名备案查询。将返回简略信息了。
可惜,写本博文的时候。发现通管局的备案链接跟本打不开了。
连主站点http://www.miibeian.gov.cn都没办法打开了。
实在是晕。害我的脚本返回的值都是错误的标识位0。
简单记一下脚本。
#!/bin/bash
while read DOMAIN
do
DOMAIN="$(echo $DOMAIN | grep -o '[a-zA-Z0-9.-]*')"
DOMAIN="$(echo $DOMAIN | sed 's/^bbs.//')"
curl -s -d "cxfs=1&ym=${DOMAIN}" http://www.miibeian.gov.cn/baxx_cx_servlet > /tmp/${DOMAIN}.txt
TOTAL=$(grep "'已备案'" /tmp/${DOMAIN}.txt | wc -l)
TOTAL2=$(grep "'审核中'" /tmp/${DOMAIN}.txt | wc -l)
if [ ${TOTAL:=0} -eq 1 ];then
CONTENT=$(grep '<td align="left">' /tmp/${DOMAIN}.txt | sed 's#<td align="left">##' | sed 's#</td>##' | sed 's/\r/ /')
STATUS=1
echo $DOMAIN $CONTENT "$STATUS" >> beian.txt.new
elif [ ${TOTAL:=0} -gt 1 ];then
STATUS=2
echo $DOMAIN "$STATUS" >> beian.txt.new
elif [ ${TOTAL2:=0} -eq 1 ];then
CONTENT=$(grep '<td align="left">' /tmp/${DOMAIN}.txt | sed 's#<td align="left">##' | sed 's#</td>##' | sed 's/\r/ /')
STATUS=3
echo $DOMAIN $CONTENT "$STATUS" >> beian.txt.new
else
STATUS=0
echo $DOMAIN "$STATUS" >> beian.txt.new
fi
rm -f /tmp/${DOMAIN}.txt
done < domain.txt.new
输入:域名列表文件domain.txt.new
输出:beian.txt.new
部分结果:
jingweiip.com 南京经纬专利商标代理有限公司 苏ICP备07005284号 1
jjsc.com 吴金遵 闽ICP备07502245号 1
pinganqufu.com 泰山平安旅行社 鲁ICP备06010844号 1
naigaovalve.com 浙江耐高电站阀门有限公司 浙ICP备05039301号 1
dgbh.cn 东莞广通化工制品有限公司 粤ICP备06090043号 1
sjzyysl.com.cn 石家庄易元塑料有限公司 冀ICP备09003344号 1
xmtrip.cn 厦门特贸国际旅行社有限公司 闽ICP备07016357号 1
njxiji.cn 南京希寄通信设备有限公司 苏ICP备09007485号 1
cn-kejing.com 南京可睛光学眼睛有限责任公司1 苏ICP备05080691号 1
cadavisa.com 北京加达加美投资咨询有限公司 京ICP备05051302号 1
kimyet.com 江门市金逸网络科技有限公司 粤ICP备07039752号 1
ls-jx.cn 江阴市林盛机械有限公司 苏ICP备05069024号 1
dianci.net 芦溪县环球电瓷制造有限公司 赣ICP备05003769号 1
chinaliteng.com 青岛力腾化工医疗研究有限公司 鲁ICP备09004537号 1
hazykx.cn 淮安卓越凯欣电子科技有限公司 苏ICP备08005522号 1
fuso.cn 青岛市海大信息网络有限公司1 鲁ICP备05028138号 1
taotaok.com 邱军隆个人 桂ICP备06014080号 1
sharediy.net 邱军隆个人 桂ICP备06014080号 1
eabuy.net 林伟彪 粤ICP备08124691号 1
ourcourse.cn 郑永平 闽ICP备09005051号 1
njhuale.com 南京华乐火花塞智能设备中心 苏ICP备07502969号 1
ssrich888.com 0
只是可惜。跑了好长一断时间。才查了4000个域名。而现在备案链接都打不开了。没办法查了。还有近3万的域名要查。
晕~
可惜,写本博文的时候。发现通管局的备案链接跟本打不开了。
连主站点http://www.miibeian.gov.cn都没办法打开了。
实在是晕。害我的脚本返回的值都是错误的标识位0。
简单记一下脚本。
#!/bin/bash
while read DOMAIN
do
DOMAIN="$(echo $DOMAIN | grep -o '[a-zA-Z0-9.-]*')"
DOMAIN="$(echo $DOMAIN | sed 's/^bbs.//')"
curl -s -d "cxfs=1&ym=${DOMAIN}" http://www.miibeian.gov.cn/baxx_cx_servlet > /tmp/${DOMAIN}.txt
TOTAL=$(grep "'已备案'" /tmp/${DOMAIN}.txt | wc -l)
TOTAL2=$(grep "'审核中'" /tmp/${DOMAIN}.txt | wc -l)
if [ ${TOTAL:=0} -eq 1 ];then
CONTENT=$(grep '<td align="left">' /tmp/${DOMAIN}.txt | sed 's#<td align="left">##' | sed 's#</td>##' | sed 's/\r/ /')
STATUS=1
echo $DOMAIN $CONTENT "$STATUS" >> beian.txt.new
elif [ ${TOTAL:=0} -gt 1 ];then
STATUS=2
echo $DOMAIN "$STATUS" >> beian.txt.new
elif [ ${TOTAL2:=0} -eq 1 ];then
CONTENT=$(grep '<td align="left">' /tmp/${DOMAIN}.txt | sed 's#<td align="left">##' | sed 's#</td>##' | sed 's/\r/ /')
STATUS=3
echo $DOMAIN $CONTENT "$STATUS" >> beian.txt.new
else
STATUS=0
echo $DOMAIN "$STATUS" >> beian.txt.new
fi
rm -f /tmp/${DOMAIN}.txt
done < domain.txt.new
输入:域名列表文件domain.txt.new
输出:beian.txt.new
部分结果:
jingweiip.com 南京经纬专利商标代理有限公司 苏ICP备07005284号 1
jjsc.com 吴金遵 闽ICP备07502245号 1
pinganqufu.com 泰山平安旅行社 鲁ICP备06010844号 1
naigaovalve.com 浙江耐高电站阀门有限公司 浙ICP备05039301号 1
dgbh.cn 东莞广通化工制品有限公司 粤ICP备06090043号 1
sjzyysl.com.cn 石家庄易元塑料有限公司 冀ICP备09003344号 1
xmtrip.cn 厦门特贸国际旅行社有限公司 闽ICP备07016357号 1
njxiji.cn 南京希寄通信设备有限公司 苏ICP备09007485号 1
cn-kejing.com 南京可睛光学眼睛有限责任公司1 苏ICP备05080691号 1
cadavisa.com 北京加达加美投资咨询有限公司 京ICP备05051302号 1
kimyet.com 江门市金逸网络科技有限公司 粤ICP备07039752号 1
ls-jx.cn 江阴市林盛机械有限公司 苏ICP备05069024号 1
dianci.net 芦溪县环球电瓷制造有限公司 赣ICP备05003769号 1
chinaliteng.com 青岛力腾化工医疗研究有限公司 鲁ICP备09004537号 1
hazykx.cn 淮安卓越凯欣电子科技有限公司 苏ICP备08005522号 1
fuso.cn 青岛市海大信息网络有限公司1 鲁ICP备05028138号 1
taotaok.com 邱军隆个人 桂ICP备06014080号 1
sharediy.net 邱军隆个人 桂ICP备06014080号 1
eabuy.net 林伟彪 粤ICP备08124691号 1
ourcourse.cn 郑永平 闽ICP备09005051号 1
njhuale.com 南京华乐火花塞智能设备中心 苏ICP备07502969号 1
ssrich888.com 0
只是可惜。跑了好长一断时间。才查了4000个域名。而现在备案链接都打不开了。没办法查了。还有近3万的域名要查。
晕~
CURL-linux下的命令行浏览器应用
WEB关闭跳出弹窗代码




