2011年12月14日星期三

Blogger使用SyntaxHighlighter插件及测试

Blogger中,也就是这个博客,使用SyntaxHighlighter来实现语法高亮,需要在模板文件中加入以下语句:

<head>
     <b:include data='blog' name='all-head-content'/>
     <!-- adel zhang 20111214 -->
     <!-- syntaxhighlighter -->
     <script src="http://sites.google.com/site/triadelphous/filestorage/shCore.txt" type="text/javascript">
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushCpp.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushJScript.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushXml.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushJava.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushBash.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushCss.txt' type='text/javascript'/>
     <link href='http://sites.google.com/site/triadelphous/filestorage/shThemeEmacs.css' rel='stylesheet' type='text/css'/> 
     <script type='text/javascript'>
     SyntaxHighlighter.defaults["quick-code"]=false;
     SyntaxHighlighter.config.bloggerMode = true;
     SyntaxHighlighter.defaults["toolbar"] = false;
     SyntaxHighlighter.all();
     </script>

因为Blogger无法存储外部文件,所以将需要的js文件托管在Google Sites上。至于文件名为什么要改成txt,这是由于有帖子
But Google Sites, like most free host doesn’t accept javascripts. Luckily there is a workaround -change the javascript file into a text file, by changing the file extension from .js to .txt.


Update:20111217
本来将下载的SyntaxHighlighter托管在Google Sites上,但不知为何链接不到了(上回测试时是可以的)。所以重新修改了模板,使用的是SytaxHighlighter作者提供的pub服务。
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shCore.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushCpp.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushJScript.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushXml.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushJava.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushBash.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushCss.js' type='text/javascript'/>
    <link href='http://alexgorbatchev.com/pub/sh/current/styles/shThemeEmacs.css' rel='stylesheet' type='text/css'/>

Update: 20120107
遇到的问题是如果代码行太长,则显示时会换行,这样就造成syntaxhighlighter的行号显示出现混乱,极为丑陋。后来发现添加shCore.css这个css后,它会出现滚动条,缓解了行号混乱的问题。但不爽的地方在于会出现竖直滚动条,原因在于shCore.css中对overflow属性使用了visible。所以我们在模板文件中加入下面这些css语句(这些类名是shCore.css里面定义的),以消除竖直方向上的滚动条。特别注意 !important 的用法,它使得css不是按照通常的定义顺序来使用,而是使用有 !important 的css语句。

/* adel: 20120107
------------- for syntaxhighlighter -----------
------------- get rid of y-sroll --------------*/
.syntaxhighlighter a,
.syntaxhighlighter div,
.syntaxhighlighter code,
.syntaxhighlighter table,
.syntaxhighlighter table td,
.syntaxhighlighter table tr,
.syntaxhighlighter table tbody,
.syntaxhighlighter table thead,
.syntaxhighlighter table caption,
.syntaxhighlighter textarea {
   overflow-y: hidden !important;
}

之前的设置去掉了 toolbar,也就是提示syntaxhighlighter信息的小问号,想想还是加上为好。所以最终的代码为:
<!-- adel zhang 20120107 -->
<!-- syntaxhighlighter -->
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shCore.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushCpp.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushJScript.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushXml.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushJava.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushBash.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushCss.js' type='text/javascript'/>
<link href='http://alexgorbatchev.com/pub/sh/current/styles/shCore.css' rel='stylesheet' type='text/css'/>
<link href='http://alexgorbatchev.com/pub/sh/current/styles/shThemeEmacs.css' rel='stylesheet' type='text/css'/>
<script type='text/javascript'>SyntaxHighlighter.config.bloggerMode = true;SyntaxHighlighter.all();</script>

2011年12月10日星期六

IPV6下GoAgent的使用

先说FAIL的部分。
今天启动系统的时候,在正常的登陆界面下输入用户名和密码后,就出现花屏,进不去系统。当时第一反应是:完蛋鸟,又得折腾一番,而且很大可能是搞不定然后重装系统,毕竟这不是X就是驱动出问题了,我完全没概念的。
更要命的是我刚把网络通给关了(见下文),也就是说不能求助GOOGLE大神。还好在Grub启动项里有个叫Resume的选项,或许能启动系统。在输入用户名和密码后,果不其然能启动到文字界面,还出现了可疑的出错信息sogouproxy.py。我才想起昨天修改过~/.profile文件,在其中添加执行sogouproxy.py,用于启动搜狗代理服务器。罪魁祸首就是系统启动时当执行用户配置文件时,sogouproxy,py就卡住了,造成X不能正常启动。只能说,学术不精,FAIL!!!

再说说IPV6下GoAgent的使用。
以前介绍过GoAgent,主要是备不时之需(你懂的)。最近校园网络改造,原本寝室可以上教育网,现在只能上校内网络(鸡肋),开通10元的网络通才只能有个教育网出口的国内权限(鸡肋),非得20元的网络通才能有国际权限(抢钱阿)。但神奇的是,即使只有校内权限,但IPV6是不受限制的,所以修改过IPV6 host的google系网站还是可以蹭的。
GoAgent是部署在GAE上的,所以很自然地想是否能通过IPV6连接GoAgent,以此作为IPV4的代理。庆幸的是,GoAgent默认支持IPV6的,只要简单地修改配置文件即可:
在proxy.ini 的 [appspot] 节中有
hosts = cn
修改为:
hosts = ipv6
在 [google]节中,默认使用cn的hosts,注释掉了hk和ipv6的hosts。为了使用ipv6,将cn的hosts注释掉,并去掉ipv6的注释。
重启Goagent,就可以通过ipv6免费上网拉,速度很OK。

2011年12月7日星期三

POJ 1009

复制至此有两个原因:
1. 这题我看完毫无头绪,佩服会解该题的人。
2. 下面的代码写的很干净

原文地址:这里


只需考虑原图中数值变化的点,其他点的编码与其左侧的点相同。
最开始用brute force,优化了输出编码中有连续0的情况,sample input可以较快通过,但提交结果超时。又换成上面的方法,可以AC,但代码改得很乱,待重写。


/*
 *  只需考虑原图中数值发生变化的点
 */
#include <stdio.h>
#include <math.h>

typedef struct _Ref {
    int index;
    int code;
} Ref;

int IN[1000][2];
Ref OUT[8000];

int encode(int n, int width, int total);
int getcode(int n);

void sort(Ref *list, int n);

int
main()
{
    int width,i,j,m,n,t,k,cnt,total,current,row,col;
    Ref cur;
   
    while(scanf("%d", &width) != EOF) {
        if(width == 0)
            break;
       
        // input  
        i = total = 0;
        scanf("%d%d", &IN[i][0], &IN[i][1]);
        while(IN[i][0] != 0 || IN[i][1] != 0) {
            total += IN[i][1];
            i++;
            scanf("%d%d", &IN[i][0], &IN[i][1]);  
        }
       
        printf("%d\n", width);
       
        cnt = i;
        n = 1;
        k = 0;
        for(m=0; m<=cnt; m++) {
            row = (n - 1) / width;
            col = (n - 1) % width;
           
            for(i=row-1; i<=row+1; i++) {
                for(j=col-1; j<=col+1; j++) {
                    t = i * width + j;
                    if(i<0 || j<0 || j>width-1 || t>total-1)
                        continue;
                   
                    OUT[k].index = t + 1;
                    OUT[k++].code = encode(t+1, width, total);                    
                }
            }
            n += IN[m][1];
        }
       
        sort(OUT, k);
       
        cur = OUT[0];
        for(i=0; i<k; i++) {
            if(OUT[i].code == cur.code)
                continue;
               
            printf("%d %d\n", cur.code, OUT[i].index - cur.index);
            cur = OUT[i];
        }
       
        printf("%d %d\n", cur.code, total - cur.index + 1);
        printf("0 0\n");
    }
    printf("0\n");
   
    return 0;
}

// 返回第n个元素的编码,n从1开始
int
getcode(int n)
{
    int t,i;
   
    i = t = 0;
    while(t < n) {
        t += IN[i++][1];
    }
   
    return IN[i-1][0];
}

// 对第n个元素进行编码,n从1开始
int
encode(int n, int width, int total)
{
    int i,j,t,code,result,row,col;
   
    code = getcode(n);
   
    row = (n - 1) / width;
    col = (n - 1) % width;
   
    result = 0;
    for(i=row-1; i<=row+1; i++) {
        for(j=col-1; j<=col+1; j++) {
            t = i * width + j;
            if(i<0 || j<0 || j>width-1 || t == n-1 || t>total-1)
                continue;
               
            if(abs(getcode(t+1) - code) > result)
                result = abs(getcode(t+1) - code);
        }
    }
   
    return result;
}

void sort(Ref *list, int n)
{
    Ref tmp;
    int i,j;
   
    for(i=0; i<n-1; i++) {
        for(j=i+1; j<n; j++) {
            if(list[i].index > list[j].index) {
                tmp = list[j];
                list[j] = list[i];
                list[i] = tmp;
            }
        }
    }
}

2011年11月21日星期一

技术人创业建站简略指南


作者: Fenng | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址: 

你是一个技术人员,你想创建一个站点,或许是一时心血来潮,或许是为了自己的兴趣爱好,或许是...「创业」前的热身准备?那么,如何少走弯路的构建起来你的 Web 站点呢?别笑,不是每个做技术的都捣鼓过个人站点,不是每个人都独立搭建过网站(我不是说个人Blog这样简单的东西),下面的简略指南或许能帮到你。毫无疑问,以下都是广告。
0. 信用卡
这个真要有!
确保有一张具备境外支付功能信用卡。这一点我想不是难事,就算是在校的学生,申请信用卡的门槛也小了很多。现在各个银行发信用卡都是求着用户的,申请的时候问清是否具备外币支付能力就好了。有了信用卡之后,你可以较为方便的申请 Paypal 、App Store 帐户、Google Checkout...
有了信用卡之后,你可以大大方方的收美元了 -- 如果你是面向非中国用户的话。
1. 购买域名
不要在国内的域名提供商那里购买域名。为了一时方便以后你会付出更多的代价,你可以看一下这里的血泪史。购买域名,我建议在 Godaddy 上购买就可以,顺便说一下,GoDaddy 也支持支付宝。如何买到好的域名? 我没办法告诉你(如果你要从别人手里购买域名的话,可以看一下 4.cn).
域名备案怎么办?如果你的内容不是特别敏感的话,不备案可能问题也不大,低调一点,别自己往墙上撞。
备选: Domain
2. 主机服务
有了域名之后,那么购买主机就要提上日程。建议用 Linode 的 VPS 服务,价格不算贵,关键是容易上手,相对比较稳定,Linode 在东京的 IDC 访问速度居然...和国内某些 IDC 差不多。有些做技术的朋友,可能自己手头有个主机什么的,尽量不要托管在 IDC 了,机器硬件坏了或是被拔了网线,会让你很闹心。
如果你的Web应用已经写的差不多了,购买主机之后不妨进行部署,在线测试。如果应用正式上线,那么不妨买一个备份服务,每个月5美元而已。
有了境外的 VPS 的一个好处是,你可以通过 VPS 「翻墙」,锻炼一下腿脚。怎么做,搜索一下就知道了。如果要简单的优化一下 VPS ,参考这篇
备选: Slicehost
3. 域名解析
为什么要单独提 DNS 解析?GoDaddy 和 Linode 都提供 DNS 解析能力,不过,域名在哪里注册的和域名在哪里解析是两回事。重要的是,DNS 修改之后的有效验证是个不小的问题,还有一个是影响因素 DNS 解析速度,所以,有必要启用智能 DNS 解析服务,DNSPod 做的相当不错。用了之后你就知道,而且,没有副作用 :)
4. 静态文件
服务器在境外,经常遇到的一个性能瓶颈静态文件(尤其是图片)的访问速度上不来,而恰好你的应用要存储较多的静态文件的话,不妨研究一下 UpYun 的服务。如果你是个开发者,你会体会到一定的妙处,去看看又拍云的 API,你会喜欢的。重要的是,价格也可控制。
阅读: 又拍云实战
备选: CloudFlare(如果你的服务是面向国外用户的话)
5. 运维监控
即使是最简单的站点也有必要关注可访问性,监控机器运行状态。推荐监控宝的免费服务,足以满足小型个人站点对于监控的要求。Google Analytics 和 Google Webmasters 有必要启用。百度的统计服务最近一段时间也越做越好。
6. 邮件方案
如果是做邮件托管的话,也就是你的站点本身的邮件帐户解决方案,Google Apps 是不二之选。如果需要发邮件给你站点的注册用户,或者做小规模的 DM , 在 Linode 上启用 EXIM 就差不多了。

N. 接下来呢?
下一步该做什么?或许有必要成为 Github 的付费用户,开发、部署、上线、推广...等你到了一定规模,咱们再来第二季。
恭喜你走上不归路,也祝愿你得到一些因为折腾而带来的乐趣.
--EOF--
(发现还是太简略了,欢迎大家留言补充)

2011年11月8日星期二

如何心算是星期几


这个心算算法的技巧在于利用了这么一个结论:对于任意给定的一年,某些特定的日期总是属于相同的星期几。我们称这些日期为“锚点“。方便记忆的锚点有:5月9号,9月5号,7月11号,11月7号,4月4号,6月6号,8月8号,10月10号,12月12号,以及2月的最后一天(平年时为28号,闰年时为29号)。前面四个日期可以通过"在7-11朝9晚5地工作"这句顺口溜来记忆。

锚点在给定的年份属于星期几是不固定的,但变化是有规律可循的。比如今年2011年,锚点都是星期一,而在2010年,锚点都是星期日。每过一年,锚点星期就往前移一天。这很好理解,每年有365天,365 % 7 = 1,所以锚点星期会移一天。因为闰年有366天,所以当年是闰年的话,跟闰年的上一年比较,锚点是向前移了两天的。比如2012年是闰年,所以锚点都是星期三

这样只要记住一些锚点的星期,就可以很快心算出任意日期的星期了。


参考资料

2011年11月6日星期日

正则表达式中的字符组[ ]


正则表达式中的字符组(Character Classes)用"[…]"表示,它容许使用者列出在某处期望匹配的字符。比如我们需要搜索单词"grey",同时又不确定它是否写成了"gray",就可以使用"gr[ea]y"进行匹配。在字符组内部,字符组元字符"-"(连字符)表示一个范围,"[0-9]"和"[a-z]"是常用的匹配数字和小写字母的简便方式。连字符"-"在字符组内部才是元字符,否则它就只能匹配普通的连字符号;即使在字符组内部,它也不一定是元字符,如果连字符出现在字符组的开头,它表示的就只是一个普通字符,而不是一个范围。问号"?"和点号"."在字符组中也是普通字符。

以上在大多数正则表达式的书中都会提到的,但这里忽略了如何在字符组内部使用"方括号"本身。这就是我遇到的问题,被困扰了好几个小时。问题来自一条sed语句:

sed -ne '/^ID_.*=/ {s/[]()|&;<>`'"'"'\\!$" []/\\&/g;p}'

当在字符组中期望匹配方括号时,"[&[]"会匹配"["和"&","[]&]"会匹配"]"和"&",而同时匹配"&","["和"]"必须写成"[]&[]",这就是上面那个例子的情况,注意最外层的方括号才是代表字符组。与之相对应,让人很困惑的是"[[]]"这样的写法,它匹配的是"[]",即左方括号后紧跟一个右方括号。

总结

所以如果要在字符组中包含"["或者"]",必须分别写在字符组的两端,即中间不该包含其他字符,以免被当作是字符组标记。

2011年11月5日星期六

Bash Shell中命令行选项/参数处理


原文地址:这里


0.引言


   写程序的时候经常要处理命令行参数,本文描述在Bash下的命令行处理方式。

   选项与参数:

   如下一个命令行:
./test.sh -f config.conf ---prefix=/home

   我们称-f为选项,它需要一个参数,即config.conf, -v 也是一个选项,但它不需要参数。

   --prefix我们称之为一个长选项,即选项本身多于一个字符,它也需要一个参数,用等号连接,当然等号不是必须的,/home可以直接写在--prefix后面,即--prefix/home,更多的限制后面具体会讲到。
   在bash中,可以用以下三种方式来处理命令行参数,每种方式都有自己的应用场景。

    * 手工处理方式
    * getopts
    * getopt

   下面我们依次讨论这三种处理方式。

1. 手工处理方式


   在手工处理方式中,首先要知道几个变量,还是以上面的命令行为例:

    *    $0 : ./test.sh,即命令本身,相当于C/C++中的argv[0]
    *    $1 : -f,第一个参数.
    *    $2 : config.conf
    *    $3, $4 ... :类推。
    *    $#  参数的个数,不包括命令本身,上例中$#为4.
    *    $@ :参数本身的列表,也不包括命令本身,如上例为 -f config.conf -v --prefix=/home
    *    $* :和$@相同,但"$*" 和 "$@"(加引号)并不同,"$*"将所有的参数解释成一个字符串,而"$@"是一个参数数组。如下例所示:


 1 #!/bin/bash 2 
 3 for arg in "$*"
 4 do
 5     echo $arg 6 done 7 
 8 for arg in "$@"
 9 do
10     echo $arg11 done12 


执行./test.sh -f config.conf -n 10 会打印:

-f config.conf -n 10    #这是"$*"的输出

-f   #以下为$@的输出

config.conf

-n

10



   所以,手工处理的方式即对这些变量的处理。因为手工处理高度依赖于你在命令行上所传参数的位置,所以一般都只用来处理较简单的参数。如

   ./test.sh 10

   而很少使用./test -n 10这种带选项的方式。 典型用法为:
#!/bin/bash
if [ x$1 != x ]
then
    #...有参数
else
then
    #...没有参数
fi


为什么要使用 x$1 != x 这种方式来比较呢?想像一下这种方式比较:


if [ -n $1 ]  #$1不为空

但如果用户不传参数的时候,$1为空,这时 就会变成 [ -n ] ,所以需要加一个辅助字符串来进行比较。

手工处理方式能满足大多数的简单需求,配合shift使用也能构造出强大的功能,但在要处理复杂选项的时候建议用下面的两种方法。

2. getopts/getopt


处理命令行参数是一个相似而又复杂的事情,为此,C提供了getopt/getopt_long等函数,
C++的boost提供了Options库,在shell中,处理此事的是getopts和getopt.

getopts和getopt功能相似但又不完全相同,其中getopt是独立的可执行文件,而getopts是由Bash内置的。

先来看看参数传递的典型用法:

    * ./test.sh -a -b -c  : 短选项,各选项不需参数
    * ./test.sh -abc   : 短选项,和上一种方法的效果一样,只是将所有的选项写在一起。
    * ./test.sh -a args -b -c :短选项,其中-a需要参数,而-b -c不需参数。
    * ./test.sh --a-long=args --b-long :长选项

我们先来看getopts,它不支持长选项。

使用getopts非常简单:
代码

#test.sh

#
!/bin/bash
while getopts "a:bc" arg #选项后面的冒号表示该选项需要参数do
        
case $arg in
             a)
                echo 
"a's arg:$OPTARG" #参数存在$OPTARG中
                ;;
             b)
                echo 
"b"
                ;;
             c)
                echo 
"c"
                ;;
             
?)  #当有不认识的选项的时候arg为?
            echo 
"unkonw argument"
        exit 
1
        ;;
        esac
done


现在就可以使用:
./test.sh -a arg -b -c

./test.sh -a arg -bc
来加载了。
应该说绝大多数脚本使用该函数就可以了,如果需要支持长选项以及可选参数,那么就需要使用getopt.
下面是getopt自带的一个例子:

#
!/bin/bash

# A small example program 
for using the new getopt(1) program.
# This program will only work with bash(
1)
# An similar program 
using the tcsh(1) script language can be found
as parse.tcsh

# Example input and output (from the bash prompt):
# .
/parse.bash -a par1 'another arg' --c-long 'wow!*\?' -cmore -" very long "
# Option a
# Option c, no argument
# Option c, argument `more
'# Option b, argument ` very long '# Remaining arguments:
--> `par1'--> `another arg'--> `wow!*\?'
# Note that we use `
"$@"' to let each command-line parameter expand to a
# separate word. The quotes around `$@' are essential!
# We need TEMP as the `eval set --' would nuke the return value of getopt.

#
-o表示短选项,两个冒号表示该选项有一个可选参数,可选参数必须紧贴选项
#如
-carg 而不能是-c arg
#
--long表示长选项
#
"$@"在上面解释过
-n:出错时的信息
-- :举一个例子比较好理解:
#我们要创建一个名字为 
"-f"的目录你会怎么办?
# mkdir 
-f #不成功,因为-f会被mkdir当作选项来解析,这时就可以使用
# mkdir 
-- -f 这样-f就不会被作为选项。

TEMP
=`getopt -o ab:c:: --long a-long,b-long:,c-long:: \
     
-'example.bash' -- "$@"`
if [ $? != 0 ] ; then echo "Terminating..." >&2 ; exit 1 ; fi

# Note the quotes around `$TEMP
': they are essential!
#set 会重新排列参数的顺序,也就是改变$1,$2...$n的值,这些值在getopt中重新排列过了
eval 
set -- "$TEMP"

#经过getopt的处理,下面处理具体选项。
while true ; do
        
case "$1" in
                
-a|--a-long) echo "Option a" ; shift ;;
                
-b|--b-long) echo "Option b, argument \`$2'" ; shift 2 ;;
                
-c|--c-long)
                        # c has an optional argument. As we are 
in quoted mode,
                        # an empty parameter will be generated 
if its optional
                        # argument 
is not found.
                        
case "$2" in
                                
"") echo "Option c, no argument"; shift 2 ;;
                                
*)  echo "Option c, argument \`$2'" ; shift 2 ;;
                        esac ;;
                
--) shift ; break ;;
                
*) echo "Internal error!" ; exit 1 ;;
        esac
done
echo 
"Remaining arguments:"
for arg do
   echo 
'--> '"\`$arg'" ;
done


比如我们使用
./test -a  -b arg arg1 -c
你可以看到,命令行中多了个arg1参数,在经过getopt和set之后,命令行会变为:
-a -b arg -c -- arg1
$1指向-a,$2指向-b,$3指向arg,$4指向-c,$5指向--,而多出的arg1则被放到了最后。

3.总结

一般小脚本手工处理也许就够了,getopts能处理绝大多数的情况,getopt较复杂,功能也更强大。