白板博客 » Archive of '十, 2008'

为什么要把视频传到YouTube?

刚刚又逛了一次Diigo,以前试用过,今天在Google groups 上碰到了diigo的成员,所以这次是去领略,这不是我想说的重点,逛完离开时忍不住点了diigo首页的视频介绍:

结果被引导到了YouTube页面,有种上当受骗的感觉,不过细想起来,曾经很多网站首页的也放类似diigo的假视频,同样是把用户引到YouTube的具体页面,当时很纳闷,YouTube不是提供了嵌入视频的代码吗?干吗还需要用户多点一下?

最开始下的结论是因为国外的人都比较”知恩图报“(虽然diigo是成都本土的),YouTube给我提供上传空间我就给你带来流量,这种理由荒谬且经不起推敲。

仔细观察了YouTube的页面后我想找到真正的原因:

1,YouTube 给你提供二次转发、订阅的可能。还可以从YouTube当中流量洪水中分享一小小股支流,还有机会被某个投资人看到,这样过冬也容易些 -.-!!

2,打分、收藏一个不少。myspace、facebook这么火,转发过去又可以赚点击,出名就快不远了!

3,好不好,自己说了不算,看看网民的评论,不爽你就把大拇指朝下BS你,Diigo不错。

4,一个嫌少,二个不够多,相关视频又多了一次延伸,我看了一下这一个视频引出39个视频

5,这个时代是属于数据挖掘的时代,外链也不放过。

你发现已经省去了上传视频的空间,不用再做评论,不用做收藏,不用做评分,不用做跟踪统计,不用特别推广。

仔细数了一下,这一个视频会至少引出59个对该视频有益的点击链接,外加评论14条,有记录的外链点击数1705次,该视频观看了50547次,合起来记录在案的就有52252次点击,还有相关视频的点击,以及一些没有被跟踪记录的转发,不用再算也发现已经赚翻了。

只言片语

今天上班时,有一小段时间看不清电脑屏幕,眼睛变花了,揉了几下才好转,看来“身体是革命的本钱”这观念还没有深入心底,需要加强灌输。

上次说到有机会写一个名为FeedAD的WordPress插件,后来真尝试了一下,刚好WordPress和jQurey都在用,学习WordPress的API花了一晚,写插件花了一晚,插件基本能用,可后来都把时间花在了更重要的事情上,所以也没有继续调试,心情好了调试好了再放出来。

还做了一个往Discuz论坛发贴的东东“论坛发贴鸡”,一是为了学习相关技术,二是为了以后发贴方便,当然也可以用来发垃圾贴,所以不会放出来。博客现在用的这个国内空间对PHP的支持不太好,我电脑又安装的是Lighttpd,也不支持里面的Curl,所以“发贴鸡”在这上面没法运转,这里有个界面可以看一下(当然无法运行),其实也没什么好看的,不看也罢。

今天一个人走在路上开始想昨晚上读到的一些东西,越想越觉得什么PHP、MySQL它们不过是一个容器,一个装数据的容器,对数据的处理功能太差,根本不能称为一门技术,至少不会是一门比较高深的技术,一家公司、一个人都可以通过学习得到,当然这里面并不包括经验,而独创的“算法”才是一家公司或一个人独有的技术,不可复制,比如百度会有排名算法,检索算法,文本相似性计算的算法,GoogleAdsense也有相关性计算算法等等,豆瓣的推荐系统也涉及相关算法,虽然用到的最基本的算法可能是公开的,但结合自己的应用就会产生新的微调。

我也去了解过豆瓣用到的推荐系统,常常搜出来的就是博士级别的论文(出乎我的意料之外),有时候因为没有阅读权限也不了解具体内容,有时候看到一些却也看的迷迷糊糊,网上也有一些其它的文章,都比较散乱,从豆瓣的一个小组的一篇讨论来看,豆瓣最基本的是“基于评分”这种最简单的推荐系统,可能还综合运用了其它的推荐系统。

我刚刚修正了之前的看法:一个网络应用最重要的除了数据外还有算法。

我在说什么?………………

原文地址:http://www.oblank.com/%e5%8f%aa%e8%a8%80%e7%89%87%e8%af%ad/ 转载时请不要删除本地址

从YAM的favicon.ico看Google的Favicon缓存服务

Google提供了很多细心的服务,比如这次试用的favicon缓存。什么是favicon什么是Google的favicon缓存服务 。不过需要指出的是,经手动测试,domain参数在加www的情况下获得favicon的成功几率更高。

效果如这样,没提供favicon的网站就会显示一个小地球:

这个服务发现用的最多的就是在Wordpress里,很多用Wordpress搭建的独立博客都会添加这个功能。

在测试时发现调用http://www.google.com/s2/favicons?domain=www.yam.com时获取的就是

而访问时显示的是这个:

比较丑的哪个应该是老版,起初怀疑是Google缓存没有更新的原因,结果打开yam的网页显示却是后者,查看源码,发现是显示指明了浏览器调用 http://www.yam.com/i/8/sky.ico,手动输入http://www.yam.com/favicon.ico发现显示是比较 丑的哪个favicon。

结论:
1,Google的缓存服务在抓取favicon时不是去抓网页里显示指明的shortcut icon,而是直接在域名后加上favicon.ico调用,有就缓存,没有就显示小地球。因些应该将favicon放在根目录下,命名为 favicon.ico,且在源码中指明它的位置,台湾YAM更不应该使用两个不同的favicon,虽然这种错误造成的影响可以忽略不计。

2,加www的域名获取favicon的成功率更高,但Google自己却必须去掉www再调用http://www.google.com/s2/favicons?domain=google.com

3,另外,Google最后提供的是图片是png格式,而favicon.ico不是标准的图片格式,但可以通过<img>标签调用。

在WordPress的RSS中添加广告图片

“不要点,是广告”,看你点不点提到要写如何将广告图片添加到WordPress的RSS中,效果就如同FeedSky的RSS广告,见下图:

WordPress提供了四种RSS输出格式,分别是RSS 0.92、RSS2、Atom、RDF(不知道真的算不算),生成它们的文件分别是位于wp-includes目录下的:feed-rss.php、feed-rss2.php、feed-atom.php、feed-rdf.php,另外还有一些评论的RSS。

这些文件中都包含有    <description><![CDATA[<?php the_excerpt_rss() ?>]]></description>或<content type=”<?php html_type_rss(); ?>” xml:base=”<?php the_permalink_rss() ?>”><![CDATA[<?php the_content('', 0, '') ?>]]></content> 这样的标签,这些就是RSS输出内容的地方了,只需要在里面加上广告内容就可以了。

以我使用RSS2为例:

找到下面这段代码:

<?php if (get_option(‘rss_use_excerpt’)) : ?>
<description><![CDATA[<?php the_excerpt_rss() ?>]]></description>
<?php else : ?>
<description><![CDATA[<?php the_excerpt_rss() ?>]]></description>
<?php if ( strlen( $post->post_content ) > 0 ) : ?>
<content:encoded><![CDATA[<?php the_content() ?>]]></content:encoded>
<?php else : ?>
<content:encoded><![CDATA[<?php the_excerpt_rss() ?>]]></content:encoded>
<?php endif; ?>

在上面这段代码出现了?>的后面添加你的广告内容,如我的为:

<hr />
<div style=”margin-top:5px; border-top:1px dotted #CCC;  padding:5px; background:#EFEFEF;”><a title=”不要点,是广告” href=”http://www.oblank.com/” target=”_blank”><img src=”http://www.oblank.com/clickitorno.gif” alt=”" /></a>
<div>查看最新文章,请<a href=”http://feed.feedsky.com/dyh1919″ target=”_blank”>订阅白板博客<img src=”http://www.feedsky.com/feed/dyh1919/sc/gif” alt=”" /></a>,或访问<a href=”http://www.oblank.com” target=”_blank”>白板博客</a></div>
</div>

最后的效果可能是这样:

<description><![CDATA[<?php the_excerpt_rss() ?><hr><div style="margin-top:5px; border-top:1px dotted #CCC;  padding:5px; background:#EFEFEF;"><a href="http://www.oblank.com/" title="不要点,是广告" target="_blank"><img src="http://www.oblank.com/clickitorno.gif"></a><br/><div>查看最新文章,请<a href="http://feed.feedsky.com/dyh1919" target="_blank">订阅白板博客<img src="http://www.feedsky.com/feed/dyh1919/sc/gif"></a>,或访问<a href="http://www.oblank.com" target="_blank">白板博客</a></div></div>]]></description>

这是最粗鲁的一种方法,好在起作用,注意广告添加的位置,等有心情了或许可以做一个相关插件,就叫FeedAD好了,不过我还要先把WrodPress的API学习一下,自己手写,不要用复制粘贴的方式使用上面的代码,会不起用哦。

新版AirPlay播放器推荐

在cnBeta上看到的,只有600k左右,免安装,下载试用后感觉不错,界面UI和操作动画做的很酷,名字是AirPlay,我还以为是用Adobe Air做的呢,结果去他们的论坛才发现不是。

集合了一些iTunes的功能,如用星星给每首歌评分,专辑封面这些功能都是iTunes里有的,看论坛他们似乎还在增加歌词功能。

下载:点这里。更多的功能介绍去这里这里看吧,不过话说回来,现在我都是网上听歌。

“不要点,是广告”,看你点不点

看别人博客的RSS有附带的广告图片,于是也给自己做了一个,加到了WordPress 的 RSS 里,具体的加法,下一篇博客说(在WordPress的RSS中添加广告图片)。

话说回来,我还这样恶搞过:

给自己的电脑桌面新建一个快捷键,这个快捷键的功能是快速锁定桌面,我把这个快捷方式起名为”点不得“(不知道是不是四川方言),结果很多朋友看到了这个快捷键都会手痒点一下,然后桌面就锁定了,哈哈,爱乱动的人始终会乱动别人的东西,这其实就是一个心理方面的小游戏,而且我觉得还很经典。

要恶搞就这么做:

在桌面上单击鼠标右键,从弹出的菜单中选择“新建→快捷方式”,然后在对话框的命令行空白处输入 “%windir%\System32\rundll32.exe user32.dll,LockWorkStation”(不要引号),单击“下一步”按钮为此快捷方式起名为“点不得”,再单击“完成”按钮。

然后给快捷方式选一个比较引人注目的图档,在新建的快捷方式上点击鼠标右键,选择”属性“,再选择”更改图标..“,选择一个比较引人注目的图标后”确定“就可以了,放在哪里就等别人中招吧。

图标文件为.ico格式,这里有一些下载

三次握手协议、猜疑链和技术爆炸

标题里的三个名词是刘慈欣的《三体erⅡ:黑暗森林》的理论基础,当然,他在小说中只指出了后两个,我加入了第一个:三次握手协议。

对互联网协议或其它通讯协议稍有了解的都会知道“三次握手协议”,它讲述的是这样一种情况:

AB两个个体进行交流时,A首先向B发出信息一,B收到信息一后进行确认,于是它向A发送了一条确认信息,这条信息被命名为信息二,A收到来自于B的信息二后就又需要向B发送一条确认信息告诉B“我已经收到你的确认信息了”,B收到后又要进行确认,由此循环产生了。

现实中为了避免循环的出现,于是提出了三次交互的限制,三次就已经近似地认为这次交互是完整的。

而《三体》所做的是把这种握手确认的协议放到太空中,两互不了解的文明,相距遥远的两个星际,于是交流产生了长时间时延(交互的过程实示上就是交流),两个文明出现了彼此的不信任,这样就引出了猜疑链:不断地相互猜疑。

与此同时,大刘还引入了第二个设定“技术爆炸”: 不同的文明发展速度是不一样的,三体文明是匀速,地球是跳跃式的。其实这里面还隐含着宇宙中除了三体、地球肯定还有其它数万种进化程度不尽相同的文明,要 确信这点,只有相信了这种假设,最后的结果才得以成立:罗辑最后的同归于尽的恐吓式威胁才吓退了三体文明,人类也才得以挽救。

不过小说最后的平衡很不平衡,在我看来,三体文明与地球文明的猜疑链还是存在的,只不过更隐藏了。

[原创科幻]一个程序员的亿万分之一次捉虫行动

本来是写一篇工作记录的,原文在这里,结果改写成了科幻小说,可能是昨天看了《三体2,黑暗森林》的缘故,不过想象力没有什么不好,感觉就是太长了些,里面的什么head 、title这些可以完全不理会。

所以有两种阅读的方法,可以是先读粗体再读细体文字,也可以直接一路读下去,文中的链接是一些相关介绍,有必要看看。

臭虫出现了,很烦,我在心里默念“这是假的,假的,假的,假的….”,但事实就是事实,它成功地骗过了最新版的“火狐V3.0.3”,但在“微软IE 7.0”面前它一丝不挂,即使用低上一个版本的“IE 6.0”也能轻易地发现它,表面上看去它什么都不是,在被IE放大100倍后仍只是一片空白。

臭虫的祖先还是一只真实的虫子,有血有肉,可惜不慎掉进了一只真空管 ,郁闷死了。它的后代逐渐进化,努力寻找到了一个大个体,它们不发达的脑子的逻辑也很简单:“比真空管大就不会掉进真空管了”。

这次这只臭虫很狡猾,把自己完全隐藏起来了,看不到它的表现行态,不过IE早具备了深入解析的能力,我把虚拟手势放到“编辑”上,在弹出的盒子里选了一把名叫“源文件”的手术刀,它能自动解剖臭虫的伪装,不到2秒伪装内部就亮堂堂地展示在了阳光下,全是些“<html><head><title><div>”这样的内脏,恶心死了,虫子现在就躲在里面。

臭虫与大个体最初还只是寄生关系,后来发展到了共生,再到后来的它们成功地融入了大个体——他们的思维,强悍地成为了大个体的一部分。

我先把伪装的肚子<div>清除掉,因为这部分最庞大,是最好的藏身之所。完成后,测试检疫,仪器上的警报亮起了红色,虫子还键在。

其实臭虫对大个体的思维几乎产生不了什么影响,只有大个体自己出现逻辑错误时它们才有机会出来走一走,晒晒太阳。即使这样那也是相当危险的,大个体已经发现了它们的存在。

还是地球纪年1969年的时候,在除虫委员会的领导下就正式部署了一项名为“二十一世纪除虫”的行动,对外的名称却要复杂很多——ARPANET,英文Advanced Research Projects Agency Network的缩写,我当然记不住这么长的英文,好在有网上有,具体内容是最高级机密,只有三人知道,这样尽可能地减少思维被臭虫探知,在20年后的地球纪年1989年,工程才正式得以实施。

我又把伪装的头部<head>的一些组织去掉了,完成后,测试检疫,仪器上的警报亮起了红色,虫子还键在。

从工程实施后又快20年过后的今天,大个体们才又稍微了解了一点“二十一世纪除虫”的具体内容:尽可能多地让思维出现逻辑错误,好让臭虫暴露行踪,然后通过IE和火狐这样的工具锁定它们,清除;最初只有少数大个体在做这样的事,这项工作被称为“编程序”,就是将思维逻辑通过一些逻辑语言组织出来,计算机重新编译后就成了0110010100这样 无序串,一目了然,臭虫当然也就无处可逃。“编程序”的大个体们被称为“程序员”,最初只有很少一部分大个体在从事这项工作,所以地位很高,微软的创始者 比尔就是这样发财的,他的微软就是靠着除虫这个行当一步步走到现在,成了一个商业巨头。火狐是后起之秀,他们主张放过一些危害不大的臭虫,集中力量捉大 虫,拥护的人不少,我是其中之一。

我又把伪装的外壳<html>也去掉了,刚才觉得没必要这么做,现在已经有必要了。完成后,测试检疫,仪器上的警报亮起了红色,虫子还键在。

比尔还有另一个身份,“除虫”行动的三人小组的成员之一,另一个成员是蒂姆

终于轮到伪装的眼睛<title>了,去掉完成后,测试检疫,仪器上的警报亮起了绿色,虫子隐藏在眼睛里,好个狡猾的家伙。在重新按标准基因序列绘制了眼睛后,测试检疫,仪器上的警报亮起了红色,这不可能,绝对不可能,标准基因序列是不可能出错的,基因序列是在爆发虫子危机之前就保存起来了,我重新审视着这只眼睛:

“<title>我是除虫者一号</title>”

完美无暇,美轮美奂,没有错误!为什么检疫器会报警?我处于惊恐中,如果标准基因都会出现错误,那说明什么,这说明我们最本质的思维也是有虫子的?虫子危机爆发的更早?伪装里根本没有虫子?

这时我的大脑里突的冒出了一小股脑电流,它急速地通过各个脑神经,连成一条线,慢慢地转变成语言:“除虫者一号,我是你的脑虫思维(它们管叫自己脑虫而不是臭虫)”,接下来,它独自演说着,像讲述着一个故事:

“脑虫世界的思维个体繁衍太快,单个人类大个体已经不具备掌控大量逻辑错误爆发的情况,比如:你们明知烟有害身体,却会吸烟;明知环境在变坏,却仍破坏坏境;明知山里有老虎偏向虎山行…..

……
….咳咳,最后一个例子,…….请原谅我的思维并不比你们高明多少……..
……

如果继续犯这种逻辑错误的话,你们会失去理智而毁灭,而我们脑虫世界又得面临掉进真空管的危险,两难的选择啊。

于是,我们脑虫世界和你们大个体世界的比尔先生和蒂姆先生一起进行了这个“二十一世纪除虫”的行动…”

“你是那个三人小组的成员之一?”我终于忍不住打断了它的话。
“不,你才是,你是人,我是虫”,电流还在脑神经中传递。
“可我什么都不记得了”
“那部分记忆已经被我吸收转化了”
“除虫行动的具体内容是什么?”
“调动全部大个体来捉虫”
“不可能”
“已经基本实现了,就是互联网”
“…..”
“…..”
“…..”
“…..”
“哦,对了,睡觉后刚才这部分谈话的内容也会被吸收转化”臭虫说。
“你有名字吗”,我问。
“虫脑……虫脑就是我的名字”
“……”
“谢谢你帮我们捉虫”,这是虫脑的最后一句话。

玩乐一下:我想给自己的这篇科幻冠一个名号“首部关于程序员的科幻小说”,结果Google出来了一本《修真的电脑程序员》,似乎是科幻类的,名号是抢不到了,于是又想了一个“中国首部关于程序员的短篇科幻”,我想换成“全球华语地区首部关于程序员的短篇科幻”也不会有人反对吧,哇呀呀,够长的,乱套了。