超神当然要一些超神的理由,就是做出来神一样的东西,让人觉得不可思议。
程序员的一些练手项目:
- 操作系统
- 编译器
- 编辑器
- web服务器
- 数据库
- 喜欢的游戏
- 浏览器
- 视频播放器
- 自动化执行工具
- whatever。
这些东西有的是很难的,即使做出来一个简单的示例也需要很多的精力。当做出来很强大的东西,也有业界的标准进行比较,足以让你找到差距。这个列表几乎一辈子也做不完,还有很多可以补充的,而且其中都是他人已竟之事,除非你可以干的更好,要不就没有实际的价值,但是你学到的东西可以在其他地方使用。做经典的项目练就强大的执行力,在下一次实际项目中发力。
突然有一天,我发现我的周围全是神,我知道我遇到了神一样的对手,我必须有一条超神之路。
其实我想告诉你,你就是神。你必须有基本的知识,才能进行。首先有一门程序语言护体,再有几门辅助,熟悉基本的数据结构算法,阅读相关书籍,注意不要读的太多,实际中体会书籍,而不只是读一下就没了。在遇到问题是去学习,在完成任务后去总结。
最近出现的东西更多,分布式相关的,目前我还没有掌握。新出现的开发模式也很多,我踏上了一条漫漫长路。
文章的重点
说了这么多虚的,来点实在的吧。就说操作系统提供的接口,有进程管理,内存管理,文件管理等等。对于初学者,肯定感觉乱七八糟的,这么多又记不住,更不知如何实现。
对于操作系统的功能,书上说抽象硬件,实在有点不容易理解。首先让我们熟悉一下shell的用法吧,有命令执行,管道,重定向,甚至可以定义变量和函数,包括一定的脚本语言特性,shell可以看做是作为一种展示操作系统接口组合可能的实例(cat cd ps > | & $ #),基本展示了系统的接口和组合的方法(xv6书上说的)。
进程管理当然很牛叉了,实现shell肯定需要fork,wait这样的东西。里面牵扯的东西,我目前还不懂,不能细说。文件管理和管道自不必多说,你肯定先要知道这些功能的存在,使用一下。我慢慢研习后再吐槽。
在实现shell时,有命令行解析,肯定会利用到词法解析的功能(这个就是编译原理中万里长征的第一步),这里不再延伸了。shell是一个应用程序,对于传入的命令调用系统内核提供的接口。
sh代码
if(fork1() == 0)
runcmd(parsecmd(buf));
wait();
其实操作系统更难以理解的是启动(有很多历史规则),首先制作一个镜像磁盘需要很多知识和工具,在磁盘启动扇区里写上执行程序,只是一个启动加载程序,真正的程序在另一块地方。就算制作好了,在真机上运行还是很费劲,必须使用虚拟机。
程序一切执行好了,把设备处理好了(此处省略了十万八千个字),这个时候有一个初始化程序,pid是1,一般情况会打开一个shell(exec sh)。
最重要的还没有说,对了,肯定是汇编语言,现在会这个的人本就不多,起码我只会几个指令。Ok ,let`s see a hello word example.
hello.asm
section .text
global _start ;must be declared for linker (ld)
_start: ;tells linker entry point
mov edx,len ;message length
mov ecx,msg ;message to write
call _print
call _sys_exit
_print:
mov ebx,1 ;file descriptor (stdout)
mov eax,4 ;system call number (sys_write)
int 0x80 ;call kernel
_sys_exit:
mov eax,1 ;system call number (sys_exit)
int 0x80 ;call kernel
section .data
msg db 'Hello, world!', 0xa ;string to be printed
len equ $ - msg ;length of the string
看看汇编语言如何转换成可执行程序。
run asm .sh
nasm -f elf hi.asm
ld -m elf_i386 -s -o hello hi.o
./hello
汇编语言的调用是先在某几个寄存器填上值,或者内存地址,然后进行系统调用就可以(在上面的例子,eax 1代表退出,eax 4 代表写指令 也需要在ecx字符地址和 ecx 长度 和ebx 1代表输出)。具体的网上有一些教程,也有一些参考手册。对比高级编程语言是f(x),就简单多了。
要写启动程序,肯定得理解启动过程,内存的分布(内存竟然有洞),BIOS提供的指令,终于有了一点起色后就可以进入c语言的世界了。
c语言的世界,又是很多人惨痛的记忆了,这里有你很多不能使用的东西,一些时候还是要借助汇编,当然你需要明白那里需要什么(用那些指令)。
就说unix 6的源码,近一万行,似乎也不是很多吗,但是里面定义的变量很多,关系复杂,没有整体结构的把屋,就很难读,关键是依赖很多其他知识,例如要理解一段代码可能需要几页辅助知识。
怎么样,需要的基础知识很多吧,是不是感觉要从入门到放弃了,当然不想放弃对不对,找本书看看,看不懂换本看,一遍不懂多看几遍。
技术方便我就理解有这么多了,也许写或者读一系列的文章是不错的。团队合作方面的就关乎软件工程了,需要更多的工具和方法论,就是经验。
当然这一切关乎思考,程序员最需要学习的就是思考。
欢迎阅读我的其它文章。