手头上有一个便宜的VPS,一直没怎么用,除了用来跑程序和VPN外。然后最近觉得没什么程序在上面跑很对不起它,就没事找事地想让它去爬点东西,但是也没想到什么好爬的,就愉快地决定让它去爬一些豆瓣的信息;
初步计划先让它爬一下豆瓣的书的信息和豆瓣用户关注被关注的关系网;这里随便写一下爬虫的杂记,作为我最近的存在感。。。
豆瓣BOOK
豆瓣的书啊,电影啊,音乐啊那些条目有一点很讨厌,就是他们的URL的编排,都是这种形式的:
http://[type].douban.com/subject/[id]/
type可以是”book”,或者”music”或者”movie”;
但是id完全没有什么规律(大概没有吧),不仅仅是说你无法从id中判断出这个条目是书还是电影还是音乐;而且就算你要找书的URL,你也不知道这些id是服从什么规律的;比如id=10000可能是一本书,但是10001可能对应的type就变成了music,也有可能是404。。。 阅读全文…
去年华为在几所高校搞了个什么算法向的比赛(好吧,前年。。),看了一部分我们系里参赛的队伍最后的演示视频,印象比较深刻的是一个类似视频或者单帧图片去除不想要的部分的图像处理题目,当时记得貌似大量的人做了这道题目,然后大量的成果效果超好,那时还在想:现在的研究生算法已经这么厉害了?直到后来某一次我需要做一个去除水印的东西后,终于觉悟这不就是一个去除水印问题么??而且。。。搜了一下,这方面的研究已经无比成熟了。。。软件都满天飞了。。【果然技术这种东西只能吓唬行外人士。。】
就现在而言,一般给图片去水印比较常见的两个方法是:
- Photoshop:这个网上搜索教程一大堆。。
- 使用去水印专用软件
关于专用软件,由于我的这方面的需求极少,我才不会为了这种破事儿去专门搞一个软件呢。至于Photoshop,我电脑里装有这个,但是一般只用于两件事,有人(比如老板)叫我用photoshop修一下图或者做一个什么图标,还有就是把博客里面上传的图的背景搞成透明(考虑到以后可能博客主题背景不是白色,所以一般图片我都会把背景弄成透明的以适应背景颜色,比如本文下面的大部分图片其实背景都是透明而不是白色的。。),至于PS用于去水印嘛,以前学习PS的时候试过,但是效果感觉不好,果然我就是和PS气场不和。。 阅读全文…
前言
好吧,我是强迫症发作来刷出在感的,因为我发现当年写博文的时候,乱开Categories,导致现在博客很多Categories下只有一篇博文,强迫症患者表示,必须至少两篇,所以我最近就来慢慢填这些坑好了。。所以今天填的是第一个坑——计算机视觉。。。【好吧,其实我不搞DIP很久了。。。
作为一个从大四毕设开始就基本没研究过图像处理的人来说,要写一篇算法的科普文,虽然不是不可以,但是你会发现和网上很多人写的差不多【好吧,一般都是别人写的比我好。。】,所以我就决定写一篇关于去年(好吧,前年)研究生数模比赛的某道题的博文好了【一直觉得那道题很适合拿来水一篇博文。。】;
当年赛题发下来时,要做的第一件事自然就是选题,我把几道题都瞄了一下,然后基本马上下定了“嗯,就做这道题吧!!”的决心;因为那道题其中最核心的一问我已经有十足的信心可以“秒杀”了!!
那道题目的大概意思我也就不说了,我说说那核心的一问吧,假如你有以下三幅卫星云图(为了让大家看的比较清楚区别,我将其转为gif了),然后你就需要估算出各个地方的风速和风向【也叫风矢场或者云导风】;
阅读全文…
其实这篇东西是2012年8月写的。。
之前咧,我在写这篇“死兔”作弊器的时候,后面就提到要写一个自动扫雷机,然后花了两个下午研究了一下,嗯,基本完成了,至少可以称之为内核了。。
先说结果吧,初级和中级都可以在1s内完成游戏,高级经过多次测试,最快4秒,最慢6秒左右。
然后汇报一下功能,嘛,就自动扫雷呗,可以在游戏开始的时候自动识别总雷数,游戏的规模大小,然后没啥别的特点了。。【下面视频可以改画质。。 阅读全文…
题目取得有点随便啊,是吧。。额,算了,谁让游戏本体我找不到了。。如果下次找到了,我就放在下面好了。。
既然如此,我就描述一下那个游戏好了。。【其实我只在好久以前玩过一下那个游戏,具体记得不是很清楚了,错了就原谅我吧,不然的话,就当我”定义”了一个新游戏好了。。】
就是说,一开始有一个正方形里面有一个圆形,圆形的颜色你自己定义,正方形内部非圆形区域颜色为黑,然后你只要点击一下那个圆,它就会分裂成四个半径为一半的圆了,分布在四个角那里,你可以设置这些圆为不同颜色,然后你再点击一下这些圆,它又会继续分裂,无穷无尽。。。大概。。。就是这样一个游戏吧。。。
然后人人网上看到了一个大触画的这个图。。。 阅读全文…
小时候就觉得人的大脑是个极其之神奇的东西,然后高中学了生物化学那些东西后,觉得脑子居然可以产生思想,感情,宇宙中居然有这样的东西的存在,然后就感慨不已,上了大学,搞了一些算法学术后,意识到一些以前并没有怎么意识到的一些大脑的功能【虽说不管怎么说其神奇程度都不及会产生情感,思想。。】,比如说人大脑的模糊算法,我们看一局棋,可以快速的判断出谁处于优势谁处于劣势,有经验的人瞄一眼天空,就知道是不是要马上下雨了。“大概怎么样”这个概念,对应于属于“模糊”,人的大脑先天就有这种神奇的功能,对于计算机这种连真正的随机数都产生不了的“渣渣”而言,人脑实在过于强大【我一直觉得,计算机之所以会有存在的价值,就在于他可以高速的做一些简单的运算,如果人脑可以快速的在1纳秒内算出根号π精确到小数点后100位的话,那计算机对我们现实的价值可能会少很多。。】。再比如说学习功能,现在多少所谓的机器学习算法其实被发明的起源都是来源于对大脑的研究。
好吧,其实我扯了好远。。真正跟本文有关的事,大脑的知觉恒常性问题【这个问题应该不能归属到模糊逻辑里面去】。什么是知觉恒常性,比如说大小恒常性,一个物体,放在离你很近的地方,或者离你很远的地方,你都可以大概知道这个物体有多大。这个就是我们大脑的大小恒常机制带来的。计算机就完全办不到了,应该。。。办不到吧。。。远处的东西虽然看上去变小了,但是你大脑还是会对得到的图像进行缩放,因为你可以从眼睛得到的图像里面得出物体的深度信息。而计算机图片就是一张二维的照片,没有深度的,即便如此,我们看照片也可以得到深度信息,而计算机却不行。。。吧。。。 阅读全文…
基于图像处理的人机交互算法中,Camshift是一个很入门很基本的目标跟踪算法,不过当年学得很窝火,因为一开始不知道在网络上找,所以就研究论文里面这个算法的详情,结果看了好久也没看懂,因为那些狗屎论文个个都在装逼,明明一个很简单的算法,非要用数学封装起来,你数学就算了,非要把一个过程用连续的积分表示出来,好吧,我原谅你积分,你为了得到一个更为一般的表达式,给我他喵的抽象出一个变换核出来!!然后引进一大堆▽,∂什么的,你知道对于一个刚学习图像处理的孩子来说,这要多伤人心!! 阅读全文…