采花大盗 发表于 2012-11-14 21:52 你这个程序运行在服务器么...?还是下载完毕后上传...
每次醒来 发表于 2012-11-14 21:58 这个文件是火车头的发布接口文件 放在程序目录里面 执行的 是火车头采集到图片地址 http://XXXXxx 发布 ...
采花大盗 发表于 2012-11-14 22:02 不明白...您继续找
每次醒来 发表于 2012-11-14 22:04 就是现在的代码只要采集到重复的网址就会重新下载 ...
采花大盗 发表于 2012-11-14 22:34 那你就跟A大做的采集百度的那个程序一样吧... 写log...
每次醒来 发表于 2012-11-15 00:05 正常是应该遇到图片地址是http开头的才会下载图片 现在不是http开头路劲的也下载 - - 导致图片重复很多 ...
采花大盗 发表于 2012-11-15 00:21 需要http开头的?第三行,试试这个.... 脑袋不灵了...想了半天-_-
每次醒来 发表于 2012-11-15 00:34 是需要遇到 http的才下载没有http的已经下载好的地址就不用下载的 我试试 ...
采花大盗 发表于 2012-11-15 00:58 哎呀...被弄糊涂了... 不行的话就弄一个记录吧....把已经下载过的图片文件的文件名记录下来,采集的时候对 ...
每次醒来 发表于 2012-11-15 00:59 更不会了,