Другие функции и методы строк

Работе со строками. Функции и методы строк.

Базовые операции

· Конкатенация (сложение)

>>>S1 = 'spam'>>>S2 = 'eggs'>>> print(S1 + S2)'spameggs'

· Дублирование строки

>>> print('spam' * 3)spamspamspam

· Длина строки (функция len)

>>>len('spam')4

· Доступ по индексу

>>>S = 'spam'>>>S[0]'s'>>>S[2]'a'>>>S[-2]'a'

Как видно из примера, в Python возможен и доступ по отрицательному индексу, при этом отсчет идет от конца строки.

· Извлечение среза

Оператор извлечения среза: [X:Y]. X – начало среза, а Y – окончание;

символ с номером Y в срез не входит. По умолчанию первый индекс равен 0, а второй - длине строки.

>>>s = 'spameggs'>>>s[3:5]'me'>>>s[2:-2]'ameg'>>>s[:6]'spameg'>>>s[1:]'pameggs'>>>s[:]'spameggs'

Кроме того, можно задать шаг, с которым нужно извлекать срез.

>>>s[::-1]'sggemaps'>>>s[3:5:-1]''>>>s[2::2]'aeg'

Другие функции и методы строк

При вызове методов необходимо помнить, что строки в Python относятся к категории неизменяемых последовательностей, то есть все функции и методы могут лишь создавать новую строку.

>>>s = 'spam'>>>s[1] = 'b'Traceback (most recent call last): File "", line 1, in s[1] = 'b'TypeError: 'str' object does not support item assignment>>>s = s[0] + 'b' + s[2:]>>>s'sbam'

Поэтому все строковые методы возвращают новую строку, которую потом следует присвоить переменной.

Почти любой тип можно привести к строке с помощью функции (конструктора) str.

>>> str(5)
'5'
>>> str(2.4)
'2.4'
>>> str(None)
'None'
>>> str([2, 3, 4])
'[2, 3, 4]'
>>> str(Exception)
"<class 'Exception'>"

Обратную операцию (преобразование строки в число) можно произвести с помощью int и float. Причём принимают они не только строки, но и байты.

>>> int(b"5")
5
>>> int("5")
5
>>> int("-28")
-28
>>> float("-24.6")
-24.6
>>> float("-3e11")
-300000000000.0
>>> float("0.3")
0.3

С ними можно работать как с массивами. Причём, если str по индексу возвращает символ, то bytes- число, и для преобразования его в символ - воспользоваться функцией chr.

>>> b[0]
97
>>> chr(b[0])
'a'
>>> u[0]
'a'

Диапазоны тоже работают. Отрицательный индекс означает отсчет с конца.

>>> b[0:2]
b'a,'
>>> b[2:4]
b'B,'
>>> b[1:4]
b',B,'
>>> u[1:4]
',B,'
>>> b[-1]
68
>>> b[:-1]
b'a,B,c,'
>>> b[:-2]
b'a,B,c'
>>> b[1:]
b',B,c,D'
>>> b[2:]
b'B,c,D'

count считает, сколько раз указанная строка находится внутри строки.

>>> u.count("a")
1
>>> u.count("A")
0
>>> b.count(b",")
3

decode у bytes преобразует байты в текст в соответствии с заданной кодировкой.

>>> ub = b.decode("utf-8")
>>> ub
'a,B,c,D'
>>> type(ub)
<class 'str'>

encode у str преобразует текст в байты.

>>> bu = u.encode("utf-8")
>>> bu
b'a,B,c,D'
>>> type(bu)
<class 'bytes'>

endswith проверяет, оканчивается ли строка/байты указанной строкой/байтами.

>>> b.endswith(b"C,d")
False
>>> b.endswith(b"c,D")
True

findищет первое вхождение указанной строки или байтов в строке или байте. Возвращает позицию (счёт с 0) или -1, если ничего не нашлось. rfind— ищет с конца строки.

>>> b.find(b"c")
4
>>> u.rfind("c")
4

join— очень полезная функция. Она принимает массив и складывает все строки из него в одну большую строку, и разделителем между элементами является сама строка, из которой вызвали функцию.

>>> sep = ", "
>>> arr = ["Саша", "Женя", "Петя", "Вася"]
>>> sep.join(arr)
'Саша, Женя, Петя, Вася'
>>> ";".join( ["1","2"] )
'1;2'

lowerи upper переводят в нижний и верхний регистр соответственно. Для типа bytes будет работать только с английскими буквами.

>>> b.lower()
b'a,b,c,d'
>>> u.upper()
'A,B,C,D'

replace заменяет в строке одну подстроку на другую.

>>> u.replace("a", "Ы")
'Ы,B,c,D'
>>> b.replace(b",", b" or ")
b'a or B or c or D'

rjustпозволяет привести короткую строку к нужной длине путём добавления перед ней пробелов или указанного символа. Для заполнения нулями можно использовать функцию zfill.

>>> tm = "18:02:"
>>> sec = "6"
>>> tm + sec
'18:02:6'
>>> tm + sec.rjust(2, "0")
'18:02:06'
>>> tm + sec.zfill(2)
'18:02:06'
>>> b.rjust(20)
b' a,B,c,D'

splitразбивает строку на несколько по указанной строке. Можно ограничить количество разбиений. rsplit разбивает строку с обратной стороны. Возвращает массив.

>>> b.split(b",")
[b'a', b'B', b'c', b'D']
>>> u.split(",", 1)
['a', 'B,c,D']
>>> u.split(",", 2)
['a', 'B', 'c,D']
>>> u.rsplit(",", 1)
['a,B,c', 'D']
>>> u.split("а нету такой подстроки!")
['a,B,c,D']

Таблица типов форматирования для строк

Код	Значение
s	Строковый
r	Строковый, но с использованием repr, а не str
c	Посимвольный
d	Десятичный
i	Целый
u	То же, что и d (no longer unsigned)
o	Восьмеричный
x	Шестнадцатеричный
X	Шестнадцатеричный в верхнем регистре
e	Floating-point exponent, нижний регистр
E	То же, что и e, но в верхнем регистре
f	Floating-point decimal
F	Floating-point decimal
g	Floating-point e или f
C	Floating-point E или F
%	Символьный %

Таблица "Функции и методы строк"

Функция или метод	Назначение
S = 'str'; S = "str"; S = '''str'''; S = """str"""	Литералы строк
S = "s\np\ta\nbbb"	Экранированные последовательности
S = r"C:\temp\new"	Неформатированные строки (подавляют экранирование)
S = b"byte"	Строка байтов
S1 + S2	Конкатенация (сложение строк)
S1 * 3	Повторение строки
S[i]	Обращение по индексу
S[i:j:step]	Извлечение среза
len(S)	Длина строки
S.find(str, [start],[end])	Поиск подстроки в строке. Возвращает номер первого вхождения или -1
S.rfind(str, [start],[end])	Поиск подстроки в строке. Возвращает номер последнего вхождения или -1
S.index(str, [start],[end])	Поиск подстроки в строке. Возвращает номер первого вхождения или вызывает ValueError
S.rindex(str, [start],[end])	Поиск подстроки в строке. Возвращает номер последнего вхождения или вызывает ValueError
S.replace(шаблон, замена)	Замена шаблона
S.split(символ)	Разбиение строки по разделителю
S.isdigit()	Состоит ли строка из цифр
S.isalpha()	Состоит ли строка из букв
S.isalnum()	Состоит ли строка из цифр или букв
S.islower()	Состоит ли строка из символов в нижнем регистре
S.isupper()	Состоит ли строка из символов в верхнем регистре
S.isspace()	Состоит ли строка из неотображаемых символов (пробел, символ перевода страницы ('\f'), "новая строка" ('\n'), "перевод каретки" ('\r'), "горизонтальная табуляция" ('\t') и "вертикальная табуляция" ('\v'))
S.istitle()	Начинаются ли слова в строке с заглавной буквы
S.upper()	Преобразование строки к верхнему регистру
S.lower()	Преобразование строки к нижнему регистру
S.startswith(str)	Начинается ли строка S с шаблона str
S.endswith(str)	Заканчивается ли строка S шаблоном str
S.join(список)	Сборка строки из списка с разделителем S
ord(символ)	Символ в его код ASCII
chr(число)	Код ASCII в символ
S.capitalize()	Переводит первый символ строки в верхний регистр, а все остальные в нижний
S.center(width, [fill])	Возвращает отцентрованную строку, по краям которой стоит символ fill (пробел по умолчанию)
S.count(str, [start],[end])	Возвращает количество непересекающихся вхождений подстроки в диапазоне [начало, конец] (0 и длина строки по умолчанию)
S.expandtabs([tabsize])	Возвращает копию строки, в которой все символы табуляции заменяются одним или несколькими пробелами, в зависимости от текущего столбца. Если TabSize не указан, размер табуляции полагается равным 8 пробелам
S.lstrip([chars])	Удаление пробельных символов в начале строки
S.rstrip([chars])	Удаление пробельных символов в конце строки
S.strip([chars])	Удаление пробельных символов в начале и в конце строки
S.partition(шаблон)	Возвращает кортеж, содержащий часть перед первым шаблоном, сам шаблон, и часть после шаблона. Если шаблон не найден, возвращается кортеж, содержащий саму строку, а затем две пустых строки
S.rpartition(sep)	Возвращает кортеж, содержащий часть перед последним шаблоном, сам шаблон, и часть после шаблона. Если шаблон не найден, возвращается кортеж, содержащий две пустых строки, а затем саму строку
S.swapcase()	Переводит символы нижнего регистра в верхний, а верхнего – в нижний
S.title()	Первую букву каждого слова переводит в верхний регистр, а все остальные в нижний
S.zfill(width)	Делает длину строки не меньшей width, по необходимости заполняя первые символы нулями
S.ljust(width, fillchar=" ")	Делает длину строки не меньшей width, по необходимости заполняя последние символы символом fillchar
S.rjust(width, fillchar=" ")	Делает длину строки не меньшей width, по необходимости заполняя первые символы символом fillchar
S.format(args, *kwargs)	Форматирование строки

<== предыдущая лекция	\|	следующая лекция ==>
Понятие о фазовом пространстве. Метод фазовой плоскости.	\|	Политическая социализация

Дата добавления: 2016-05-16; просмотров: 855;