Hello World | Adel Zhang

2011年12月14日星期三

Blogger使用SyntaxHighlighter插件及测试

Blogger中,也就是这个博客，使用SyntaxHighlighter来实现语法高亮，需要在模板文件中加入以下语句:

<head>
     <b:include data='blog' name='all-head-content'/>
     <!-- adel zhang 20111214 -->
     <!-- syntaxhighlighter -->
     <script src="http://sites.google.com/site/triadelphous/filestorage/shCore.txt" type="text/javascript">
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushCpp.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushJScript.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushXml.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushJava.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushBash.txt' type='text/javascript'/>
     <script src='http://sites.google.com/site/triadelphous/filestorage/shBrushCss.txt' type='text/javascript'/>
     <link href='http://sites.google.com/site/triadelphous/filestorage/shThemeEmacs.css' rel='stylesheet' type='text/css'/> 
     <script type='text/javascript'>
     SyntaxHighlighter.defaults["quick-code"]=false;
     SyntaxHighlighter.config.bloggerMode = true;
     SyntaxHighlighter.defaults["toolbar"] = false;
     SyntaxHighlighter.all();
     </script>

因为Blogger无法存储外部文件，所以将需要的js文件托管在Google Sites上。至于文件名为什么要改成txt,这是由于有帖子说

But Google Sites, like most free host doesn’t accept javascripts. Luckily there is a workaround -change the javascript file into a text file, by changing the file extension from .js to .txt.

Update:20111217
本来将下载的SyntaxHighlighter托管在Google Sites上，但不知为何链接不到了（上回测试时是可以的）。所以重新修改了模板，使用的是SytaxHighlighter作者提供的pub服务。

<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shCore.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushCpp.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushJScript.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushXml.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushJava.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushBash.js' type='text/javascript'/>
    <script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushCss.js' type='text/javascript'/>
    <link href='http://alexgorbatchev.com/pub/sh/current/styles/shThemeEmacs.css' rel='stylesheet' type='text/css'/>

Update: 20120107
遇到的问题是如果代码行太长，则显示时会换行，这样就造成syntaxhighlighter的行号显示出现混乱，极为丑陋。后来发现添加shCore.css这个css后，它会出现滚动条，缓解了行号混乱的问题。但不爽的地方在于会出现竖直滚动条,原因在于shCore.css中对overflow属性使用了visible。所以我们在模板文件中加入下面这些css语句(这些类名是shCore.css里面定义的)，以消除竖直方向上的滚动条。特别注意 !important 的用法，它使得css不是按照通常的定义顺序来使用，而是使用有 !important 的css语句。

/* adel: 20120107
------------- for syntaxhighlighter -----------
------------- get rid of y-sroll --------------*/
.syntaxhighlighter a,
.syntaxhighlighter div,
.syntaxhighlighter code,
.syntaxhighlighter table,
.syntaxhighlighter table td,
.syntaxhighlighter table tr,
.syntaxhighlighter table tbody,
.syntaxhighlighter table thead,
.syntaxhighlighter table caption,
.syntaxhighlighter textarea {
   overflow-y: hidden !important;
}

之前的设置去掉了 toolbar，也就是提示syntaxhighlighter信息的小问号，想想还是加上为好。所以最终的代码为：

<!-- adel zhang 20120107 -->
<!-- syntaxhighlighter -->
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shCore.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushCpp.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushJScript.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushXml.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushJava.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushBash.js' type='text/javascript'/>
<script src='http://alexgorbatchev.com/pub/sh/current/scripts/shBrushCss.js' type='text/javascript'/>
<link href='http://alexgorbatchev.com/pub/sh/current/styles/shCore.css' rel='stylesheet' type='text/css'/>
<link href='http://alexgorbatchev.com/pub/sh/current/styles/shThemeEmacs.css' rel='stylesheet' type='text/css'/>
<script type='text/javascript'>SyntaxHighlighter.config.bloggerMode = true;SyntaxHighlighter.all();</script>

2011年12月10日星期六

IPV6下GoAgent的使用

先说FAIL的部分。
今天启动系统的时候，在正常的登陆界面下输入用户名和密码后，就出现花屏，进不去系统。当时第一反应是：完蛋鸟，又得折腾一番，而且很大可能是搞不定然后重装系统，毕竟这不是X就是驱动出问题了，我完全没概念的。
更要命的是我刚把网络通给关了（见下文），也就是说不能求助GOOGLE大神。还好在Grub启动项里有个叫Resume的选项，或许能启动系统。在输入用户名和密码后，果不其然能启动到文字界面，还出现了可疑的出错信息sogouproxy.py。我才想起昨天修改过~/.profile文件，在其中添加执行sogouproxy.py，用于启动搜狗代理服务器。罪魁祸首就是系统启动时当执行用户配置文件时，sogouproxy,py就卡住了，造成X不能正常启动。只能说，学术不精，FAIL!!!

再说说IPV6下GoAgent的使用。
以前介绍过GoAgent，主要是备不时之需（你懂的）。最近校园网络改造，原本寝室可以上教育网，现在只能上校内网络（鸡肋），开通10元的网络通才只能有个教育网出口的国内权限(鸡肋），非得20元的网络通才能有国际权限（抢钱阿）。但神奇的是，即使只有校内权限，但IPV6是不受限制的，所以修改过IPV6 host的google系网站还是可以蹭的。
GoAgent是部署在GAE上的，所以很自然地想是否能通过IPV6连接GoAgent，以此作为IPV4的代理。庆幸的是，GoAgent默认支持IPV6的，只要简单地修改配置文件即可：
在proxy.ini 的 [appspot] 节中有
hosts = cn
修改为:
hosts = ipv6
在 [google]节中，默认使用cn的hosts，注释掉了hk和ipv6的hosts。为了使用ipv6,将cn的hosts注释掉，并去掉ipv6的注释。
重启Goagent，就可以通过ipv6免费上网拉，速度很OK。

2011年12月7日星期三

POJ 1009

复制至此有两个原因：
1. 这题我看完毫无头绪，佩服会解该题的人。
2. 下面的代码写的很干净

原文地址:这里

只需考虑原图中数值变化的点，其他点的编码与其左侧的点相同。
最开始用brute force，优化了输出编码中有连续0的情况，sample input可以较快通过，但提交结果超时。又换成上面的方法，可以AC，但代码改得很乱，待重写。

/*
* 只需考虑原图中数值发生变化的点
*/
#include <stdio.h>
#include <math.h>

typedef struct _Ref {
int index;
int code;
} Ref;

int IN[1000][2];
Ref OUT[8000];

int encode(int n, int width, int total);
int getcode(int n);

void sort(Ref *list, int n);

int
main()
{
int width,i,j,m,n,t,k,cnt,total,current,row,col;
Ref cur;

while(scanf("%d", &width) != EOF) {
if(width == 0)
break;

// input
i = total = 0;
scanf("%d%d", &IN[i][0], &IN[i][1]);
while(IN[i][0] != 0 || IN[i][1] != 0) {
total += IN[i][1];
i++;
scanf("%d%d", &IN[i][0], &IN[i][1]);
}

printf("%d\n", width);

cnt = i;
n = 1;
k = 0;
for(m=0; m<=cnt; m++) {
row = (n - 1) / width;
col = (n - 1) % width;

for(i=row-1; i<=row+1; i++) {
for(j=col-1; j<=col+1; j++) {
t = i * width + j;
if(i<0 || j<0 || j>width-1 || t>total-1)
continue;

OUT[k].index = t + 1;
OUT[k++].code = encode(t+1, width, total);
}
}
n += IN[m][1];
}

sort(OUT, k);

cur = OUT[0];
for(i=0; i<k; i++) {
if(OUT[i].code == cur.code)
continue;

printf("%d %d\n", cur.code, OUT[i].index - cur.index);
cur = OUT[i];
}

printf("%d %d\n", cur.code, total - cur.index + 1);
printf("0 0\n");
}
printf("0\n");

return 0;
}

// 返回第n个元素的编码，n从1开始
int
getcode(int n)
{
int t,i;

i = t = 0;
while(t < n) {
t += IN[i++][1];
}

return IN[i-1][0];
}

// 对第n个元素进行编码，n从1开始
int
encode(int n, int width, int total)
{
int i,j,t,code,result,row,col;

code = getcode(n);

row = (n - 1) / width;
col = (n - 1) % width;

result = 0;
for(i=row-1; i<=row+1; i++) {
for(j=col-1; j<=col+1; j++) {
t = i * width + j;
if(i<0 || j<0 || j>width-1 || t == n-1 || t>total-1)
continue;

if(abs(getcode(t+1) - code) > result)
result = abs(getcode(t+1) - code);
}
}

return result;
}

void sort(Ref *list, int n)
{
Ref tmp;
int i,j;

for(i=0; i<n-1; i++) {
for(j=i+1; j<n; j++) {
if(list[i].index > list[j].index) {
tmp = list[j];
list[j] = list[i];
list[i] = tmp;
}
}
}
}

2011年11月21日星期一

技术人创业建站简略指南

作者: Fenng | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址: http://www.dbanotes.net/startup/Tech_Startup_Ver_002.html

你是一个技术人员，你想创建一个站点，或许是一时心血来潮，或许是为了自己的兴趣爱好，或许是...「创业」前的热身准备？那么，如何少走弯路的构建起来你的 Web 站点呢？别笑，不是每个做技术的都捣鼓过个人站点，不是每个人都独立搭建过网站(我不是说个人Blog这样简单的东西)，下面的简略指南或许能帮到你。毫无疑问，以下都是广告。

0. 信用卡

这个真要有!

确保有一张具备境外支付功能信用卡。这一点我想不是难事，就算是在校的学生，申请信用卡的门槛也小了很多。现在各个银行发信用卡都是求着用户的，申请的时候问清是否具备外币支付能力就好了。有了信用卡之后，你可以较为方便的申请 Paypal 、App Store 帐户、Google Checkout...

有了信用卡之后，你可以大大方方的收美元了 -- 如果你是面向非中国用户的话。

1. 购买域名

不要在国内的域名提供商那里购买域名。为了一时方便以后你会付出更多的代价，你可以看一下这里的血泪史。购买域名，我建议在 Godaddy 上购买就可以，顺便说一下，GoDaddy 也支持支付宝。如何买到好的域名? 我没办法告诉你(如果你要从别人手里购买域名的话，可以看一下 4.cn).

域名备案怎么办？如果你的内容不是特别敏感的话，不备案可能问题也不大，低调一点，别自己往墙上撞。

备选: Domain

2. 主机服务

有了域名之后，那么购买主机就要提上日程。建议用 Linode 的 VPS 服务，价格不算贵，关键是容易上手，相对比较稳定，Linode 在东京的 IDC 访问速度居然...和国内某些 IDC 差不多。有些做技术的朋友，可能自己手头有个主机什么的，尽量不要托管在 IDC 了，机器硬件坏了或是被拔了网线，会让你很闹心。

如果你的Web应用已经写的差不多了，购买主机之后不妨进行部署，在线测试。如果应用正式上线，那么不妨买一个备份服务，每个月5美元而已。

有了境外的 VPS 的一个好处是，你可以通过 VPS 「翻墙」，锻炼一下腿脚。怎么做，搜索一下就知道了。如果要简单的优化一下 VPS ，参考这篇。

备选: Slicehost

3. 域名解析

为什么要单独提 DNS 解析？GoDaddy 和 Linode 都提供 DNS 解析能力，不过，域名在哪里注册的和域名在哪里解析是两回事。重要的是，DNS 修改之后的有效验证是个不小的问题，还有一个是影响因素 DNS 解析速度，所以，有必要启用智能 DNS 解析服务，DNSPod 做的相当不错。用了之后你就知道，而且，没有副作用 :)

4. 静态文件

服务器在境外，经常遇到的一个性能瓶颈静态文件(尤其是图片)的访问速度上不来，而恰好你的应用要存储较多的静态文件的话，不妨研究一下 UpYun 的服务。如果你是个开发者，你会体会到一定的妙处，去看看又拍云的 API，你会喜欢的。重要的是，价格也可控制。

阅读: 又拍云实战

备选: CloudFlare(如果你的服务是面向国外用户的话)

5. 运维监控

即使是最简单的站点也有必要关注可访问性，监控机器运行状态。推荐监控宝的免费服务，足以满足小型个人站点对于监控的要求。Google Analytics 和 Google Webmasters 有必要启用。百度的统计服务最近一段时间也越做越好。

6. 邮件方案

如果是做邮件托管的话，也就是你的站点本身的邮件帐户解决方案，Google Apps 是不二之选。如果需要发邮件给你站点的注册用户，或者做小规模的 DM , 在 Linode 上启用 EXIM 就差不多了。

备选: 网易免费企业邮局/腾讯企业邮箱

N. 接下来呢?

下一步该做什么？或许有必要成为 Github 的付费用户，开发、部署、上线、推广...等你到了一定规模，咱们再来第二季。

恭喜你走上不归路，也祝愿你得到一些因为折腾而带来的乐趣.

--EOF--

(发现还是太简略了，欢迎大家留言补充)

2011年11月8日星期二

如何心算是星期几

这个心算算法的技巧在于利用了这么一个结论：对于任意给定的一年，某些特定的日期总是属于相同的星期几。我们称这些日期为“锚点“。方便记忆的锚点有：5月9号，9月5号，7月11号，11月7号，4月4号，6月6号，8月8号，10月10号，12月12号，以及2月的最后一天（平年时为28号，闰年时为29号）。前面四个日期可以通过"在7-11朝9晚5地工作"这句顺口溜来记忆。

锚点在给定的年份属于星期几是不固定的，但变化是有规律可循的。比如今年2011年，锚点都是星期一,而在2010年，锚点都是星期日。每过一年，锚点星期就往前移一天。这很好理解，每年有365天，365 % 7 = 1,所以锚点星期会移一天。因为闰年有366天，所以当年是闰年的话，跟闰年的上一年比较，锚点是向前移了两天的。比如2012年是闰年，所以锚点都是星期三。

这样只要记住一些锚点的星期，就可以很快心算出任意日期的星期了。

参考资料

2011年11月6日星期日

正则表达式中的字符组[ ]

正则表达式中的字符组(Character Classes)用"[…]"表示，它容许使用者列出在某处期望匹配的字符。比如我们需要搜索单词"grey",同时又不确定它是否写成了"gray",就可以使用"gr[ea]y"进行匹配。在字符组内部，字符组元字符"-"（连字符）表示一个范围，"[0-9]"和"[a-z]"是常用的匹配数字和小写字母的简便方式。连字符"-"在字符组内部才是元字符，否则它就只能匹配普通的连字符号；即使在字符组内部，它也不一定是元字符，如果连字符出现在字符组的开头，它表示的就只是一个普通字符，而不是一个范围。问号"?"和点号"."在字符组中也是普通字符。

以上在大多数正则表达式的书中都会提到的，但这里忽略了如何在字符组内部使用"方括号"本身。这就是我遇到的问题，被困扰了好几个小时。问题来自一条sed语句:

sed -ne '/^ID_.*=/ {s/[]()|&;<>`'"'"'\\!$" []/\\&/g;p}'

当在字符组中期望匹配方括号时，"[&[]"会匹配"["和"&","[]&]"会匹配"]"和"&",而同时匹配"&"，"["和"]"必须写成"[]&[]"，这就是上面那个例子的情况，注意最外层的方括号才是代表字符组。与之相对应，让人很困惑的是"[[]]"这样的写法，它匹配的是"[]",即左方括号后紧跟一个右方括号。

总结

所以如果要在字符组中包含"["或者"]"，必须分别写在字符组的两端，即中间不该包含其他字符，以免被当作是字符组标记。

2011年11月5日星期六

Bash Shell中命令行选项/参数处理

原文地址:这里

0.引言

   写程序的时候经常要处理命令行参数，本文描述在Bash下的命令行处理方式。

   选项与参数：

   如下一个命令行：

./test.sh -f config.conf -v --prefix=/home

   我们称-f为选项，它需要一个参数，即config.conf, -v 也是一个选项，但它不需要参数。

   --prefix我们称之为一个长选项，即选项本身多于一个字符，它也需要一个参数，用等号连接，当然等号不是必须的，/home可以直接写在--prefix后面，即--prefix/home,更多的限制后面具体会讲到。
   在bash中，可以用以下三种方式来处理命令行参数，每种方式都有自己的应用场景。

    * 手工处理方式
    * getopts
    * getopt

   下面我们依次讨论这三种处理方式。

1. 手工处理方式

   在手工处理方式中，首先要知道几个变量，还是以上面的命令行为例：

    *    $0 ： ./test.sh,即命令本身，相当于C/C++中的argv[0]
    *    $1 ： -f,第一个参数.
    *    $2 ： config.conf
    *    $3, $4 ... ：类推。
    *    $# 参数的个数，不包括命令本身，上例中$#为4.
    *    $@ ：参数本身的列表，也不包括命令本身，如上例为 -f config.conf -v --prefix=/home
    *    $* ：和$@相同，但"$*" 和 "$@"(加引号)并不同，"$*"将所有的参数解释成一个字符串，而"$@"是一个参数数组。如下例所示：

 1 #!/bin/bash 2 

 3 for arg in "$*"

 4 do

 5     echo $arg 6 done 7 

 8 for arg in "$@"

 9 do

10     echo $arg11 done12

执行./test.sh -f config.conf -n 10 会打印：

-f config.conf -n 10    #这是"$*"的输出

-f   #以下为$@的输出

config.conf

-n

10

   所以，手工处理的方式即对这些变量的处理。因为手工处理高度依赖于你在命令行上所传参数的位置，所以一般都只用来处理较简单的参数。如

   ./test.sh 10

   而很少使用./test -n 10这种带选项的方式。典型用法为：

#!/bin/bash

if [ x$1 != x ]

then

    #...有参数else

then

    #...没有参数

fi

为什么要使用 x$1 != x 这种方式来比较呢？想像一下这种方式比较：

if [ -n $1 ] #$1不为空

但如果用户不传参数的时候，$1为空，这时就会变成 [ -n ] ,所以需要加一个辅助字符串来进行比较。

手工处理方式能满足大多数的简单需求，配合shift使用也能构造出强大的功能，但在要处理复杂选项的时候建议用下面的两种方法。

2. getopts/getopt

处理命令行参数是一个相似而又复杂的事情，为此，C提供了getopt/getopt_long等函数，
C++的boost提供了Options库，在shell中，处理此事的是getopts和getopt.

getopts和getopt功能相似但又不完全相同，其中getopt是独立的可执行文件，而getopts是由Bash内置的。

先来看看参数传递的典型用法:

    * ./test.sh -a -b -c ：短选项，各选项不需参数
    * ./test.sh -abc   ：短选项，和上一种方法的效果一样，只是将所有的选项写在一起。
    * ./test.sh -a args -b -c ：短选项，其中-a需要参数，而-b -c不需参数。
    * ./test.sh --a-long=args --b-long ：长选项

我们先来看getopts,它不支持长选项。

使用getopts非常简单：
代码

#test.sh

#!/bin/bash

while getopts "a:bc" arg #选项后面的冒号表示该选项需要参数do

        case $arg in

             a)

                echo "a's arg:$OPTARG" #参数存在$OPTARG中

                ;;

             b)

                echo "b"

                ;;

             c)

                echo "c"

                ;;

             ?)  #当有不认识的选项的时候arg为?

            echo "unkonw argument"

        exit 1

        ;;

        esac

done

现在就可以使用：
./test.sh -a arg -b -c
或
./test.sh -a arg -bc
来加载了。
应该说绝大多数脚本使用该函数就可以了，如果需要支持长选项以及可选参数，那么就需要使用getopt.
下面是getopt自带的一个例子：

#!/bin/bash

# A small example program for using the new getopt(1) program.

# This program will only work with bash(1)

# An similar program using the tcsh(1) script language can be found

# as parse.tcsh

# Example input and output (from the bash prompt):

# ./parse.bash -a par1 'another arg' --c-long 'wow!*\?' -cmore -b " very long "

# Option a

# Option c, no argument

# Option c, argument `more'# Option b, argument ` very long '# Remaining arguments:

# --> `par1'# --> `another arg'# --> `wow!*\?'

# Note that we use `"$@"' to let each command-line parameter expand to a

# separate word. The quotes around `$@' are essential!

# We need TEMP as the `eval set --' would nuke the return value of getopt.

#-o表示短选项，两个冒号表示该选项有一个可选参数，可选参数必须紧贴选项

#如-carg 而不能是-c arg

#--long表示长选项

#"$@"在上面解释过

# -n:出错时的信息

# -- ：举一个例子比较好理解：

#我们要创建一个名字为 "-f"的目录你会怎么办？

# mkdir -f #不成功，因为-f会被mkdir当作选项来解析，这时就可以使用

# mkdir -- -f 这样-f就不会被作为选项。

TEMP=`getopt -o ab:c:: --long a-long,b-long:,c-long:: \

     -n 'example.bash' -- "$@"`

if [ $? != 0 ] ; then echo "Terminating..." >&2 ; exit 1 ; fi

# Note the quotes around `$TEMP': they are essential!

#set 会重新排列参数的顺序，也就是改变$1,$2...$n的值，这些值在getopt中重新排列过了

eval set -- "$TEMP"

#经过getopt的处理，下面处理具体选项。

while true ; do

        case "$1" in

                -a|--a-long) echo "Option a" ; shift ;;

                -b|--b-long) echo "Option b, argument \`$2'" ; shift 2 ;;

                -c|--c-long)

                        # c has an optional argument. As we are in quoted mode,

                        # an empty parameter will be generated if its optional

                        # argument is not found.

                        case "$2" in

                                "") echo "Option c, no argument"; shift 2 ;;

                                *)  echo "Option c, argument \`$2'" ; shift 2 ;;

                        esac ;;

                --) shift ; break ;;

                *) echo "Internal error!" ; exit 1 ;;

        esac

done

echo "Remaining arguments:"

for arg do

   echo '--> '"\`$arg'" ;

done

比如我们使用
./test -a -b arg arg1 -c
你可以看到,命令行中多了个arg1参数，在经过getopt和set之后，命令行会变为：
-a -b arg -c -- arg1
$1指向-a,$2指向-b,$3指向arg,$4指向-c,$5指向--,而多出的arg1则被放到了最后。

3.总结

一般小脚本手工处理也许就够了，getopts能处理绝大多数的情况，getopt较复杂，功能也更强大。

订阅：博文 (Atom)