2.4. 基本语法
基础知识
仅仅打印输出 hello world
是不够的,对吧?你想要做的远不止这些——你想要得到一些输入,操作它并从中得到一些东西。我们可以使用常量和变量在 Python 中实现这一点,在本章中我们还会学习其它的一些概念。
注释
注释 是 #
符号右侧的任何文本,主要用作程序读者的注释。
比如:
print('hello world') # 注意,print 是一个函数。
或者:
#注意,print 是一个函数。
print('hello world')
在程序中要使用尽可能多的有用注释:
- 解释假设(或者前提/条件)
- 解释重要的决定
- 解释重要的细节
- 解释你想要解决的问题
- 解释你在程序中试图克服的问题,等等。
这对程序的读者非常有用,这样他们就可以很容易地理解程序正在做什么。请记住,在六个月之后,读者可能就是你自己!
文字常量
一个文字常量的例子是一个数字,如, 5
、1.23
;或者是一个字符串,如, 'This is a string'
或 "It's a string!"
。
它被称为文字,是因为它是 文字的 ——你使用的是它的字面上的值。 数字 2
就是代表它自己,而不代表其它——它是一个 常量,因为它的值不能改变。因此,所有这些都被称为文字常量。
数字
数字主要有两种类型——整数和浮点数。
整数的一个例子是 2
,它只是一个整数。
浮点数(floating point numbers,或者简称为 floats )的例子有 3.23
和 52.3E-4
。 其中, E
表示 10 的幂。在这种情况下, 52.3E-4
就等于 52.3 * 10^-4
。
经验丰富的程序员的注意事项
没有单独的
long
类型。int
类型可以是任意大小的整数。
字符串
字符串是 字符 的 序列 。字符串本质上就是一堆单词。
在 Python 程序中,字符串基本上是无处不在,所以一定要注意下面的内容。
单引号
你可以用单引号指定字符串,如 'Quote me on this'
。
所有的空格,即引号内的空格和制表符,均保持原样。
双引号
双引号中的字符串与单引号中的字符串完全相同。如, "What's your name?"
。
三引号
你可以使用三引号——("""
或 '''
)指定多行字符串。你可以在三引号中自由地使用单引号和双引号。例如:
'''This is a multi-line string. This is the first line.
This is the second line.
"What's your name?," I asked.
He said "Bond, James Bond."
'''
字符串是不可改变的
这就意味着,一旦你创建了一个字符串,你就不能再改变它了。尽管这看上去不是什么好事,但是事实却恰恰相反。在接下来的各种程序中,我们将会了解到为什么这不是一个限制。
C/C++ 程序员请注意
在 Python 中,没有单独的
char
数据类型。根本就没有必要拥有单独的char
数据类型,并且我保证,你不会对它心心念念的。
Perl/PHP 程序员请注意
要记住,单引号字符串和双引号字符串是相同的——他们没有任何区别。
format 方法
有时候我们可能想从其它信息中构造字符串。这就是 format()
方法可以发挥作用的地方。
将下面几行内容保存为 str_format.py
文件:
age = 20
name = 'Swaroop'
print('{0} was {1} years old when he wrote this book'.format(name, age))
print('Why is {0} playing with that python?'.format(name))
输出:
$ python str_format.py
Swaroop was 20 years old when he wrote this book
Why is Swaroop playing with that python?
它是如何工作的
字符串可以使用某些规范(这里的规范,类似于标签),然后可以调用 format
方法,用 format
方法的相关参数替换这些规范。
看一下我们第一次使用 {0}
的地方,它对应于变量 name
,这是 format 方法的第一个参数。类似地,第二个规范是 {1}
,对应于 age
,这是 format 方法的第二个参数。注意, Python 从 0 开始计数,这就意味着第一个位置的索引号是 0 ,第二个位置的索引号是 1 ,依次类推。
注意,我们也可以使用字符串连接实现相同的效果:
name + ' is ' + str(age) + ' years old'
但是,这样长得太难看,更容易出错。其次,对字符串的转换,通过 format
方法可以自动完成,而不像在本例中一样需要显式地转换为字符串。第三,当使用 format
方法时,我们可以更改消息,而不需要处理使用的变量,反之亦然。
还要注意一点,这些数字是可选的,可填可不填,所以你也可以这样写:
age = 20
name = 'Swaroop'
print('{} was {} years old when he wrote this book'.format(name, age))
print('Why is {} playing with that python?'.format(name))
这里的输出和前一个程序的输出完全相同。
在 format
方法中,Python 所做的事是将每个参数值替换到指定的位置。可以有更加详细的规范,例如:
# 取十进制小数点后的精度为 3 ,得到的浮点数为 '0.333'
print('{0:.3f}'.format(1.0/3))
# 填充下划线 (_) ,文本居中
# 将 '___hello___' 的宽度扩充为 11
print('{0:_^11}'.format('hello'))
# 用基于关键字的方法打印显示 'Swaroop wrote A Byte of Python'
print('{name} wrote {book}'.format(name='Swaroop', book='A Byte of Python'))
输出:
0.333
___hello___
Swaroop wrote A Byte of Python
由于我们正在讨论的是格式,要注意 print
总是以一个不可见的 「新的一行」 字符(\n
)作为结尾,因此对 print
的重复调用将在每个单独的行上打印输出。为了防止这个换行符被打印输出,你可以指定它以一个空(即,什么都没有)作为 end
:
print('a', end='')
print('b', end='')
输出为:
ab
或者你可以用空格作为 end
:
print('a', end=' ')
print('b', end=' ')
print('c')
输出为:
a b c
转义序列
假如,你想要一个字符串含有一个单引号('
),那该怎么办?例如,字符串是 "What's your name?"
。你不能直接用 'What's your name?'
因为 Python 会混淆字符串的起始和结尾位置。因此,你必须指定这个单引号不是代表字符串的结尾。这可以通过所谓的 转义序列 来实现。你可以将单引号指定为 \'
:注意是反斜杠。现在,你可以将字符串指定为 'What\'s your name?'
。
指定特殊字符串的另一个方法是 "What's your name?"
即,使用双引号。类似地,要想在双引号字符串中使用双引号本身,仍然必须要使用转义序列。另外,只能使用转义序列 \\
表示反斜杠本身。
如果你想要指定两行字符串呢?一种方法是使用 前面 所示的三引号字符串,或者你可以对换行符 \n
使用转义序列来表示开始新的一行。比如:
'This is the first line\nThis is the second line'
另一个非常有用的转义序列是制表符: \t
。还有很多其它的转义序列,但我在这里只提到了最有用的几个转义序列。
需要注意的一点是,在字符串中,行末尾的单个反斜杠表示字符串在下一行中继续,但不添加换行符。例如:
"This is the first sentence.\
This is the second sentence."
等价于
"This is the first sentence. This is the second sentence."
原始字符串
如果你需要指定一些没有特殊处理(转义序列等)的字符串,那么你需要指定一个 原始 字符串,指定方法是在字符串前面加上 r
或者 R
。例如:
r"Newlines are indicated by \n"
正则表达式的用户请注意
在处理正则表达式时,我们一般使用原始字符串。否则,可能需要进行大量的反向操作。例如,可以用
'\\1'
或r'\1'
进行反向引用。
变量
仅仅使用文字常量的话,很快就会变得枯燥乏味——我们需要某种方法来存储和操作任何信息。这就是 变量 出现的原因。变量,正如这个名字所暗示的——它们的值可以变化,即,你可以使用变量存储任何内容。变量只是存储信息的计算机内存当中的一部分。和文字常量不同的是,你需要一些方法来访问这些变量,因此你需要为它们命名。
标识符命名
变量是标识符的例子。 标识符 是用来标识 某事物 的名称。在命名标识符的时候必须遵循一些规则:
- 标识符的第一个字符必须是字母(大写 ASCII 或小写 ASCII 或 Unicode 字符)或者下划线 (
_
)。 - 标识符的其余部分可以由字母、下划线 (
_
) 或者数字 (0-9) 组成。 - 标识符的名称区分大小写。例如,
myname
和myName
是 不 相同的。注意前者中的小写n
和后者中的大写N
。 - 有效 标识符名称的例子有
i
、name_2_3
。 无效 标识符名称的例子有2things
、this is spaced out
、my-name
以及>a1b2_c3
。
数据类型
变量可以保存不同类型(数据类型)的值。基本类型是数字和字符串,我们已经讨论过了。在后面的章节中,我们将看到如何使用 classes 创建自己的类型。
对象
记住,在 Python 中,一切皆 对象 。这意味着一般情况下,在 Python 中,我们不会说「某物」而是说「对象」。
面向对象编程的程序员请注意:
从某种意义上说,Python 的面向对象是非常纯粹的,因为一切皆对象,包括数字、字符串和函数。
现在我们来看一下,如何使用变量和文字常量。请保存下面的例子并且运行程序。
如何编写 Python 程序?
此后,保存和运行 Python 程序的标准流程如下:
对于 PyCharm
- 打开 PyCharm.
- 用之前提到的文件名创建新的文件。
- 输入例子中给出的程序代码。
- 右击并运行当前文件。
注意:当你需要提供 命令行参数 时,点击 Run(运行)
-> Edit Configurations(编辑配置)
然后在 Script parameters:(脚本参数)
部分中键入参数,然后点击 OK(确定)
按钮:
对于其它的编辑器
- 打开你选择的编辑器。
- 键入例子中给出的程序代码。
- 将文件保存为前面提到的文件名。
- 在解释器中运行命令
python program.py
,以此运行程序。
例子:使用变量和文字常量
键入并运行下面的程序:
# 文件名: var.py
i = 5
print(i)
i = i + 1
print(i)
s = '''This is a multi-line string.
This is the second line.'''
print(s)
输出:
5
6
This is a multi-line string.
This is the second line.
它是如何工作的
下面是这个程序的工作原理。首先,我们使用赋值运算符 (=
) 将常量 5
赋值给变量 i
。这一行我们称之为(陈述)语句,因为它陈述了需要完成一些事情,在本例中,我们将变量名 i
与值 5
连接起来。接下来,我们使用 print
语打印输出 i
的值,不言而喻,它会将变量的值打印输出到屏幕上。
然后,我们令 i
中的值加 1
,并将新值保存到 i
中。然后我们打印输出 i
,不出意外的话,我们会得到 6
。
同样,我们也可以将文本字符串赋值给变量 s
然后将其打印输出。
静态语言程序员请注意
变量可以直接通过赋值来使用。不需要任何声明或者数据类型定义。
逻辑行和物理行
物理行是当你写程序的时候,你眼睛 看到 的行。逻辑行是 Python 看到 的一个程序语句。Python 默认每一个 物理行 对应一个 逻辑行 。
一个逻辑行的一个例子就是一个语句,如 print 'hello world'
——如果这是单独一行(正如你在编辑器中看到的那样),那么这也对应于一个物理行。
默认情况下,Python 推荐一行一个语句,这会使代码更具有可读性。
如果你希望在单个物理行中编写更多的逻辑行,则必须使用分号 (;
) 显式地指定此逻辑行/此语句的结尾。例如:
i = 5
print(i)
实际上,这等价于
i = 5;
print(i);
也等价于
i = 5; print(i);
等价于
i = 5; print(i)
然而,我 强烈建议 你坚持 一行最多一个语句 ,不要使用分号。事实上,我 从来没有 在 Python 程序中使用过或看到过分号。
在某种情况下,这个观念非常有用,如:有一行很长的代码,你可以使用反斜杠将其分解为多个物理行。我们称之为 显式行连接:
s = 'This is a string.\
This continues the string.'
print(s)
输出:
This is a string.This continues the string.
同样,
i =\
5
等价于
i = 5
有时候,有一种隐含的假设,你不需要使用反斜杠。在这种情况下,逻辑行有开始括号、开始方括号或者开始花括号,但是没有结束括号。我们称之为 隐式行连接 。在后面的章节中,当我们使用 list(列表) 编程时,你就可以看到这一点。
缩进
空格在 Python 中非常重要。实际上, 行首的空格非常重要 。这就是所谓的 缩进 。逻辑行开头的前导空格(空格和制表符)用于确定逻辑行的缩进级别,然后用于确定语句的分组。
这就意味着同一组的语句 必须 有相同的缩进。每一个这样的语句集被称为 语句块 。我们将在后面章节中的例子中看到语句块有多么重要。
需要牢记的一件事情是,错误的缩进会导致报错。例如:
i = 5
# 错误如下!注意,在行的开头处有一个空格
print('Value is', i)
print('I repeat, the value is', i)
当你运行该程序时,你会得到下面的错误:
File "whitespace.py", line 3
print('Value is', i)
^
IndentationError: unexpected indent
注意,第二行的开头处有一个空格。 Python 指示的错误告诉我们,程序的语法无效,即程序没有按照正确的语法规则编写。对你来讲,这意味着 你不能随意开始一个新的语句块 (当然,你一直使用的默认主语句块除外)。可以使用新语句块情况,我们将会在后面的章节中详细介绍。例如, 控制流。
如何缩进
使用四个空格进行缩进。这是 Python 语言的官方建议。优秀的编辑器会自动为你完成缩进操作。要确保你缩进时使用的空格数量一致,否则,程序将无法运行或出现意外的情况。
静态语言程序员请注意
Python 将始终使用缩进进行分块,永远不会使用花括号。运行
from __future__ import braces
可以了解更多信息。
总结
现在我们已经了解了很多细节,那我们就可以继续讨论更加有趣的内容了,比如,控制流语句。务必熟悉本章所述的内容。
本译文仅用于学习和交流目的,转载请务必注明文章译者、出处、和本文链接
我们的翻译工作遵照 CC 协议,如果我们的工作有侵犯到您的权益,请及时联系我们。