PHP下载/采集远程图片到本地

news/2024/7/8 7:08:36

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

PHP下载/采集远程图片到本地01
/**
02* 下载远程图片到本地
03*
04* @param string $url 远程文件地址
05* @param string $filename 保存后的文件名(为空时则为随机生成的文件名,否则为原文件名)
06* @param array $fileType 允许的文件类型
07* @param string $dirName 文件保存的路径(路径其余部分根据时间系统自动生成)
08* @param int $type 远程获取文件的方式
09* @return json 返回文件名、文件的保存路径
10* @author blog.snsgou.com
11*/
12
function download_image($url, $fileName = '', $dirName, $fileType = array('jpg', 'gif', 'png'), $type = 1)
13
{
14if ($url == '')
15{
16return false;
17}
1819// 获取文件原文件名
20$defaultFileName = basename($url);
2122// 获取文件类型
23$suffix = substr(strrchr($url, '.'), 1);
24if (!in_array($suffix, $fileType))
25{
26return false;
27}
2829// 设置保存后的文件名
30$fileName = $fileName == '' ? time() . rand(0, 9) . '.' . $suffix : $defaultFileName;
3132// 获取远程文件资源
33if ($type)
34{
35$ch = curl_init();
36$timeout = 30;
37curl_setopt($ch, CURLOPT_URL, $url);
38curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
39curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
40$file = curl_exec($ch);
41curl_close($ch);
42}
43else
44{
45ob_start();
46readfile($url);
47$file = ob_get_contents();
48ob_end_clean();
49}
5051// 设置文件保存路径
52//$dirName = $dirName . '/' . date('Y', time()) . '/' . date('m', time()) . '/' . date('d', time());
53$dirName = $dirName . '/' . date('Ym', time());
54if (!file_exists($dirName))
55{
56mkdir($dirName, 0777, true);
57}
5859// 保存文件
60$res = fopen($dirName . '/' . $fileName, 'a');
61fwrite($res, $file);
62fclose($res);
6364return array(
65'fileName' => $fileName,
66'saveDir' => $dirName
67);
68
}实战经历:
博客中有些图片是直接引用其他网站的,这些天不知道咋地,估计是对方做了防盗链操作,导致博客中的图片显示不出来,没办法,只好用PHP批量采集下来,并且批量替换博文中的图片地址:
01
/**
02* 批量下载博客中的图片到本地
03*/
04
public function index()
05
{
06global $_G;
0708$blogModel = model('Blog', 'blog');
09$list = $blogModel->order('gid desc')->limit(10)->findPage();
1011$page = get_gpc('page') ? get_gpc('page') : 1;
12$totalPages = $list['totalPages'];
13$page = $page + 1;
1415if ($page > $totalPages)
16{
17die('更新完毕!');
18}
1920foreach ($list['data'] as $val)
21{
22$content = $val['content'];
23$excerpt = $val['excerpt'];
2425$_G['isContentUpdate'] = $_G['isExcerptUpdate'] = false;
2627/* 内容 */
28$content = preg_replace_callback("/src=\"(http:\/\/images\.cnblogs\.com\/cnblogs_com[^\"]+)\"/", function($matches) {
2930global $_G;
31$_G['isContentUpdate'] = true;
3233// 下载远程图片到本地
34$res = download_image($matches[1], 'old', 'd:/PHP/xampp/htdocs/emlog/data/upload');
3536// 返回 下载后的图片url地址
37return 'src="/data/upload/' . date('Ym', time()) . '/' . $res['fileName'] . '"';
3839}, $content);
4041/* 摘要 */
42$excerpt = preg_replace_callback("/src=\"(http:\/\/images\.cnblogs\.com\/cnblogs_com[^\"]+)\"/", function($matches) {
4344global $_G;
45$_G['isExcerptUpdate'] = true;
4647// 下载远程图片d到本地
48$res = download_image($matches[1], 'old', 'd:/PHP/xampp/htdocs/emlog/data/upload');
4950// 返回 下载后的图片url地址
51return 'src="/data/upload/' . date('Ym', time()) . '/' . $res['fileName'] . '"';
5253}, $excerpt);
5455/* 更新数据库 */
56$where = array(
57'gid' => $val['gid']
58);
59$data = array();
6061if ($_G['isContentUpdate'])
62{
63$data['content'] = $content;
64}
6566if ($_G['isExcerptUpdate'])
67{
68$data['excerpt'] = $excerpt;
69}
7071if ($data)
72{
73$blogModel->where($where)->save($data);
74}
75}
7677/* 更新下一页 */
78$url = url('blog/Main/index', array('page' => $page));
79$msg = '正在更新' . $page . '/' . $totalPages;
80redirect($url, 2, $msg);
81
}


转载于:https://my.oschina.net/yonghan/blog/602485


http://lihuaxi.xjx100.cn/news/257591.html

相关文章

Redis 缓存使用技巧和设计方案

欢迎关注方志朋的博客,回复”666“获面试宝典缓存能够有效地加速应用的读写速度,同时也可以降低后端负载,对日常应用的开发至关重要。下面会介绍缓存使用技巧和设计方案,包含如下内容:缓存的收益和成本分析、缓存更新策…

《C#精彩实例教程》小组阅读02 – Visual Studio简介与安装

本图文详细介绍了什么是Visual Studio,以及Visual Studio的安装过程。 上一次我们介绍了Visual Studio 2015的下载,以及MSDN。 这一次,我们说说什么是Visual Studio以及如何安装。 Visual Studio(简称VS)是微软公司…

Imagination 推新款GPU IP,首次实现桌面级光线追踪效果

游戏界被炒得最热的概念可能就是光线追踪技术了,不仅仅是PC端的游戏。光线追踪所展示出来的画面效果也确实惊艳,可以让我们感叹到图像技术达到的一个新高度。 但是实际上,光线追踪并不是一个新技术。10年前,光追就是游戏玩家茶余…

万字解读:预训练模型最新综述!

↑↑↑关注后"星标"Datawhale每日干货 & 每月组队学习,不错过Datawhale学术 作者:太子长琴,Datawhale意向成员如何在有限数据下训练出高效的深度学习模型?本文深入研究了预训练的前世今生,并带领读者一起…

免费DIY!微软一口气开源1500个3D表情包,超可爱

‍‍视学算法报道 编辑:Joey 桃子【导读】1500多种3D表情,随意DIY。表情包可以说是信息时代最伟大的发明之一了。任何场景,任何心情,一个简单的emoji就能表达你的情绪,让沟通更高效。有了表情包,是不是比一…

whoosh学习(1)

2019独角兽企业重金招聘Python工程师标准>>> 背景 当前项目需要用到全文搜索redis不方便实现mysql效率太低搜索引擎选择 pylucenewhoosh(似乎更受欢迎,文档最全)为什么选择 纯python实现,省了编译二进制包的繁琐过程。…

更快的 Maven 来了!!!性能提升 300%

欢迎关注方志朋的博客,回复”666“获面试宝典Maven 经常被拿来和 Gradle 做对比,最大的劣势之一就是 Maven 构建慢,Gradle 比 Maven 构建速度快 2 到 10 倍,而如今 Maven 也可以更快了。Apache Maven 团队从 Gradle 和 Takari(Mav…

golang内存分配概述

golang内存分配概述 golang的内存分配机制主要类似于tcmalloc机制,来快速高效的分配与管理内存,从而高效分配与管理内存。 有关 tcmalloc 的详细资料大家可参考官网,简单概括就是通过预先分配一个大的堆,每个线程都管理一块小内…