2011年11月21日星期一

技术人创业建站简略指南


作者: Fenng | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址: 

你是一个技术人员,你想创建一个站点,或许是一时心血来潮,或许是为了自己的兴趣爱好,或许是...「创业」前的热身准备?那么,如何少走弯路的构建起来你的 Web 站点呢?别笑,不是每个做技术的都捣鼓过个人站点,不是每个人都独立搭建过网站(我不是说个人Blog这样简单的东西),下面的简略指南或许能帮到你。毫无疑问,以下都是广告。
0. 信用卡
这个真要有!
确保有一张具备境外支付功能信用卡。这一点我想不是难事,就算是在校的学生,申请信用卡的门槛也小了很多。现在各个银行发信用卡都是求着用户的,申请的时候问清是否具备外币支付能力就好了。有了信用卡之后,你可以较为方便的申请 Paypal 、App Store 帐户、Google Checkout...
有了信用卡之后,你可以大大方方的收美元了 -- 如果你是面向非中国用户的话。
1. 购买域名
不要在国内的域名提供商那里购买域名。为了一时方便以后你会付出更多的代价,你可以看一下这里的血泪史。购买域名,我建议在 Godaddy 上购买就可以,顺便说一下,GoDaddy 也支持支付宝。如何买到好的域名? 我没办法告诉你(如果你要从别人手里购买域名的话,可以看一下 4.cn).
域名备案怎么办?如果你的内容不是特别敏感的话,不备案可能问题也不大,低调一点,别自己往墙上撞。
备选: Domain
2. 主机服务
有了域名之后,那么购买主机就要提上日程。建议用 Linode 的 VPS 服务,价格不算贵,关键是容易上手,相对比较稳定,Linode 在东京的 IDC 访问速度居然...和国内某些 IDC 差不多。有些做技术的朋友,可能自己手头有个主机什么的,尽量不要托管在 IDC 了,机器硬件坏了或是被拔了网线,会让你很闹心。
如果你的Web应用已经写的差不多了,购买主机之后不妨进行部署,在线测试。如果应用正式上线,那么不妨买一个备份服务,每个月5美元而已。
有了境外的 VPS 的一个好处是,你可以通过 VPS 「翻墙」,锻炼一下腿脚。怎么做,搜索一下就知道了。如果要简单的优化一下 VPS ,参考这篇
备选: Slicehost
3. 域名解析
为什么要单独提 DNS 解析?GoDaddy 和 Linode 都提供 DNS 解析能力,不过,域名在哪里注册的和域名在哪里解析是两回事。重要的是,DNS 修改之后的有效验证是个不小的问题,还有一个是影响因素 DNS 解析速度,所以,有必要启用智能 DNS 解析服务,DNSPod 做的相当不错。用了之后你就知道,而且,没有副作用 :)
4. 静态文件
服务器在境外,经常遇到的一个性能瓶颈静态文件(尤其是图片)的访问速度上不来,而恰好你的应用要存储较多的静态文件的话,不妨研究一下 UpYun 的服务。如果你是个开发者,你会体会到一定的妙处,去看看又拍云的 API,你会喜欢的。重要的是,价格也可控制。
阅读: 又拍云实战
备选: CloudFlare(如果你的服务是面向国外用户的话)
5. 运维监控
即使是最简单的站点也有必要关注可访问性,监控机器运行状态。推荐监控宝的免费服务,足以满足小型个人站点对于监控的要求。Google Analytics 和 Google Webmasters 有必要启用。百度的统计服务最近一段时间也越做越好。
6. 邮件方案
如果是做邮件托管的话,也就是你的站点本身的邮件帐户解决方案,Google Apps 是不二之选。如果需要发邮件给你站点的注册用户,或者做小规模的 DM , 在 Linode 上启用 EXIM 就差不多了。

N. 接下来呢?
下一步该做什么?或许有必要成为 Github 的付费用户,开发、部署、上线、推广...等你到了一定规模,咱们再来第二季。
恭喜你走上不归路,也祝愿你得到一些因为折腾而带来的乐趣.
--EOF--
(发现还是太简略了,欢迎大家留言补充)

2011年11月8日星期二

如何心算是星期几


这个心算算法的技巧在于利用了这么一个结论:对于任意给定的一年,某些特定的日期总是属于相同的星期几。我们称这些日期为“锚点“。方便记忆的锚点有:5月9号,9月5号,7月11号,11月7号,4月4号,6月6号,8月8号,10月10号,12月12号,以及2月的最后一天(平年时为28号,闰年时为29号)。前面四个日期可以通过"在7-11朝9晚5地工作"这句顺口溜来记忆。

锚点在给定的年份属于星期几是不固定的,但变化是有规律可循的。比如今年2011年,锚点都是星期一,而在2010年,锚点都是星期日。每过一年,锚点星期就往前移一天。这很好理解,每年有365天,365 % 7 = 1,所以锚点星期会移一天。因为闰年有366天,所以当年是闰年的话,跟闰年的上一年比较,锚点是向前移了两天的。比如2012年是闰年,所以锚点都是星期三

这样只要记住一些锚点的星期,就可以很快心算出任意日期的星期了。


参考资料

2011年11月6日星期日

正则表达式中的字符组[ ]


正则表达式中的字符组(Character Classes)用"[…]"表示,它容许使用者列出在某处期望匹配的字符。比如我们需要搜索单词"grey",同时又不确定它是否写成了"gray",就可以使用"gr[ea]y"进行匹配。在字符组内部,字符组元字符"-"(连字符)表示一个范围,"[0-9]"和"[a-z]"是常用的匹配数字和小写字母的简便方式。连字符"-"在字符组内部才是元字符,否则它就只能匹配普通的连字符号;即使在字符组内部,它也不一定是元字符,如果连字符出现在字符组的开头,它表示的就只是一个普通字符,而不是一个范围。问号"?"和点号"."在字符组中也是普通字符。

以上在大多数正则表达式的书中都会提到的,但这里忽略了如何在字符组内部使用"方括号"本身。这就是我遇到的问题,被困扰了好几个小时。问题来自一条sed语句:

sed -ne '/^ID_.*=/ {s/[]()|&;<>`'"'"'\\!$" []/\\&/g;p}'

当在字符组中期望匹配方括号时,"[&[]"会匹配"["和"&","[]&]"会匹配"]"和"&",而同时匹配"&","["和"]"必须写成"[]&[]",这就是上面那个例子的情况,注意最外层的方括号才是代表字符组。与之相对应,让人很困惑的是"[[]]"这样的写法,它匹配的是"[]",即左方括号后紧跟一个右方括号。

总结

所以如果要在字符组中包含"["或者"]",必须分别写在字符组的两端,即中间不该包含其他字符,以免被当作是字符组标记。

2011年11月5日星期六

Bash Shell中命令行选项/参数处理


原文地址:这里


0.引言


   写程序的时候经常要处理命令行参数,本文描述在Bash下的命令行处理方式。

   选项与参数:

   如下一个命令行:
./test.sh -f config.conf ---prefix=/home

   我们称-f为选项,它需要一个参数,即config.conf, -v 也是一个选项,但它不需要参数。

   --prefix我们称之为一个长选项,即选项本身多于一个字符,它也需要一个参数,用等号连接,当然等号不是必须的,/home可以直接写在--prefix后面,即--prefix/home,更多的限制后面具体会讲到。
   在bash中,可以用以下三种方式来处理命令行参数,每种方式都有自己的应用场景。

    * 手工处理方式
    * getopts
    * getopt

   下面我们依次讨论这三种处理方式。

1. 手工处理方式


   在手工处理方式中,首先要知道几个变量,还是以上面的命令行为例:

    *    $0 : ./test.sh,即命令本身,相当于C/C++中的argv[0]
    *    $1 : -f,第一个参数.
    *    $2 : config.conf
    *    $3, $4 ... :类推。
    *    $#  参数的个数,不包括命令本身,上例中$#为4.
    *    $@ :参数本身的列表,也不包括命令本身,如上例为 -f config.conf -v --prefix=/home
    *    $* :和$@相同,但"$*" 和 "$@"(加引号)并不同,"$*"将所有的参数解释成一个字符串,而"$@"是一个参数数组。如下例所示:


 1 #!/bin/bash 2 
 3 for arg in "$*"
 4 do
 5     echo $arg 6 done 7 
 8 for arg in "$@"
 9 do
10     echo $arg11 done12 


执行./test.sh -f config.conf -n 10 会打印:

-f config.conf -n 10    #这是"$*"的输出

-f   #以下为$@的输出

config.conf

-n

10



   所以,手工处理的方式即对这些变量的处理。因为手工处理高度依赖于你在命令行上所传参数的位置,所以一般都只用来处理较简单的参数。如

   ./test.sh 10

   而很少使用./test -n 10这种带选项的方式。 典型用法为:
#!/bin/bash
if [ x$1 != x ]
then
    #...有参数
else
then
    #...没有参数
fi


为什么要使用 x$1 != x 这种方式来比较呢?想像一下这种方式比较:


if [ -n $1 ]  #$1不为空

但如果用户不传参数的时候,$1为空,这时 就会变成 [ -n ] ,所以需要加一个辅助字符串来进行比较。

手工处理方式能满足大多数的简单需求,配合shift使用也能构造出强大的功能,但在要处理复杂选项的时候建议用下面的两种方法。

2. getopts/getopt


处理命令行参数是一个相似而又复杂的事情,为此,C提供了getopt/getopt_long等函数,
C++的boost提供了Options库,在shell中,处理此事的是getopts和getopt.

getopts和getopt功能相似但又不完全相同,其中getopt是独立的可执行文件,而getopts是由Bash内置的。

先来看看参数传递的典型用法:

    * ./test.sh -a -b -c  : 短选项,各选项不需参数
    * ./test.sh -abc   : 短选项,和上一种方法的效果一样,只是将所有的选项写在一起。
    * ./test.sh -a args -b -c :短选项,其中-a需要参数,而-b -c不需参数。
    * ./test.sh --a-long=args --b-long :长选项

我们先来看getopts,它不支持长选项。

使用getopts非常简单:
代码

#test.sh

#
!/bin/bash
while getopts "a:bc" arg #选项后面的冒号表示该选项需要参数do
        
case $arg in
             a)
                echo 
"a's arg:$OPTARG" #参数存在$OPTARG中
                ;;
             b)
                echo 
"b"
                ;;
             c)
                echo 
"c"
                ;;
             
?)  #当有不认识的选项的时候arg为?
            echo 
"unkonw argument"
        exit 
1
        ;;
        esac
done


现在就可以使用:
./test.sh -a arg -b -c

./test.sh -a arg -bc
来加载了。
应该说绝大多数脚本使用该函数就可以了,如果需要支持长选项以及可选参数,那么就需要使用getopt.
下面是getopt自带的一个例子:

#
!/bin/bash

# A small example program 
for using the new getopt(1) program.
# This program will only work with bash(
1)
# An similar program 
using the tcsh(1) script language can be found
as parse.tcsh

# Example input and output (from the bash prompt):
# .
/parse.bash -a par1 'another arg' --c-long 'wow!*\?' -cmore -" very long "
# Option a
# Option c, no argument
# Option c, argument `more
'# Option b, argument ` very long '# Remaining arguments:
--> `par1'--> `another arg'--> `wow!*\?'
# Note that we use `
"$@"' to let each command-line parameter expand to a
# separate word. The quotes around `$@' are essential!
# We need TEMP as the `eval set --' would nuke the return value of getopt.

#
-o表示短选项,两个冒号表示该选项有一个可选参数,可选参数必须紧贴选项
#如
-carg 而不能是-c arg
#
--long表示长选项
#
"$@"在上面解释过
-n:出错时的信息
-- :举一个例子比较好理解:
#我们要创建一个名字为 
"-f"的目录你会怎么办?
# mkdir 
-f #不成功,因为-f会被mkdir当作选项来解析,这时就可以使用
# mkdir 
-- -f 这样-f就不会被作为选项。

TEMP
=`getopt -o ab:c:: --long a-long,b-long:,c-long:: \
     
-'example.bash' -- "$@"`
if [ $? != 0 ] ; then echo "Terminating..." >&2 ; exit 1 ; fi

# Note the quotes around `$TEMP
': they are essential!
#set 会重新排列参数的顺序,也就是改变$1,$2...$n的值,这些值在getopt中重新排列过了
eval 
set -- "$TEMP"

#经过getopt的处理,下面处理具体选项。
while true ; do
        
case "$1" in
                
-a|--a-long) echo "Option a" ; shift ;;
                
-b|--b-long) echo "Option b, argument \`$2'" ; shift 2 ;;
                
-c|--c-long)
                        # c has an optional argument. As we are 
in quoted mode,
                        # an empty parameter will be generated 
if its optional
                        # argument 
is not found.
                        
case "$2" in
                                
"") echo "Option c, no argument"; shift 2 ;;
                                
*)  echo "Option c, argument \`$2'" ; shift 2 ;;
                        esac ;;
                
--) shift ; break ;;
                
*) echo "Internal error!" ; exit 1 ;;
        esac
done
echo 
"Remaining arguments:"
for arg do
   echo 
'--> '"\`$arg'" ;
done


比如我们使用
./test -a  -b arg arg1 -c
你可以看到,命令行中多了个arg1参数,在经过getopt和set之后,命令行会变为:
-a -b arg -c -- arg1
$1指向-a,$2指向-b,$3指向arg,$4指向-c,$5指向--,而多出的arg1则被放到了最后。

3.总结

一般小脚本手工处理也许就够了,getopts能处理绝大多数的情况,getopt较复杂,功能也更强大。