В данной статье метод рассматривается как способ решения систем линейных уравнений (СЛАУ). Метод является аналитическим, то есть позволяет написать алгоритм решения в общем виде, а потом уже подставлять туда значения из конкретных примеров. В отличие от матричного метода или формул Крамера, при решении системы линейных уравнений методом Гаусса можно работать и с теми, что имеют решений бесконечно много. Или не имеют его вовсе.
Что значит решить методом Гаусса?
Для начала необходимо нашу систему уравнений записать в виде матрицы. Выглядит это следующим образом. Берется система:

Коэффициенты записываются в виде таблицы, а справа отдельным столбиком - свободные члены. Столбец со свободными членами отделяется для удобства вертикальной чертой. Матрица, включающая в себя этот столбец, называется расширенной.

Далее основную матрицу с коэффициентами нужно привести к верхней треугольной форме. Это основной момент решения системы методом Гаусса. Проще говоря, после определенных манипуляций матрица должна выглядеть так, чтобы в ее левой нижней части стояли одни нули:

Тогда, если записать новую матрицу опять как систему уравнений, можно заметить, что в последней строке уже содержится значение одного из корней, которое затем подставляется в уравнение выше, находится еще один корень, и так далее.
Это описание решения методом Гаусса в самых общих чертах. А что получится, если вдруг у системы нет решения? Или их бесконечно много? Чтобы ответить на эти и еще множество вопросов, необходимо рассмотреть отдельно все элементы, использующиеся при решении методом Гаусса.
Матрицы, их свойства
Никакого скрытого смысла в матрице нет. Это просто удобный способ записи данных для последующих операций с ними. Бояться их не надо даже школьникам.
Матрица всегда прямоугольная, потому что так удобнее. Даже в методе Гаусса, где все сводится к построению матрицы треугольного вида, в записи фигурирует прямоугольник, только с нулями на том месте, где нет чисел. Нули можно не записывать, но они подразумеваются.
Матрица имеет размер. Ее "ширина" - число строк (m), "длина" - число столбцов (n). Тогда размер матрицы A (для их обозначения обычно используются заглавные латинские буквы) будет обозначаться как Am×n. Если m=n, то эта матрица квадратная, и m=n - ее порядок. Соответственно, любой элемент матрицы A можно обозначить через номер его строки и столбца: axy; x - номер строки, изменяется [1, m], y - номер столбца, изменяется [1, n].
В методе Гаусса матрицы - это не основной момент решения. В принципе, все операции можно выполнять непосредственно с самими уравнениями, однако запись получится куда более громоздкая, и в ней будет гораздо легче запутаться.
Определитель
Еще у матрицы есть определитель. Это очень важная характеристика. Выяснять его смысл сейчас не стоит, можно просто показать, как он вычисляется, а потом рассказать, какие свойства матрицы он определяет. Наиболее простой способ нахождения определителя - через диагонали. В матрице проводятся воображаемые диагонали; элементы, находящиеся на каждой из них, перемножаются, а затем полученные произведения складываются: диагонали с наклоном вправо - со знаком "плюс", с наклоном влево - со знаком "минус".

Крайне важно отметить, что вычислять определитель можно только у квадратной матрицы. Для прямоугольной матрицы можно сделать следующее: из количества строк и количества столбцов выбрать наименьшее (пусть это будет k), а затем в матрице произвольным образом отметить k столбцов и k строк. Элементы, находящиеся на пересечении выбранных столбцов и строк, составят новую квадратную матрицу. Если определитель такой матрицы будет числом, отличным от нуля, то назовется базисным минором первоначальной прямоугольной матрицы.
Перед тем как приступить к решению системы уравнений методом Гаусса, не мешает посчитать определитель. Если он окажется нулевым, то сразу можно говорить, что у матрицы количество решений либо бесконечно, либо их вообще нет. В таком печальном случае надо идти дальше и узнавать про ранг матрицы.
Классификация систем
Существует такое понятие, как ранг матрицы. Это максимальный порядок ее определителя, отличного от нуля (если вспомнить про базисный минор, можно сказать, что ранг матрицы - порядок базисного минора).
По тому, как обстоят дела с рангом, СЛАУ можно разделить на:
- Совместные. У совместных систем ранг основной матрицы (состоящей только из коэффициентов) совпадает с рангом расширенной (со столбцом свободных членов). Такие системы имеют решение, но необязательно одно, поэтому дополнительно совместные системы делят на:
- - определенные - имеющие единственное решение. В определенных системах равны ранг матрицы и количество неизвестных (или число столбцов, что есть одно и то же);
- - неопределенные - с бесконечным количеством решений. Ранг матриц у таких систем меньше количества неизвестных.
- Несовместные. У таких систем ранги основной и расширенной матриц не совпадают. Несовместные системы решения не имеют.
Метод Гаусса хорош тем, что позволяет в ходе решения получить либо однозначное доказательство несовместности системы (без вычисления определителей больших матриц), либо решение в общем виде для системы с бесконечным числом решений.
Элементарные преобразования
До того как приступить непосредственно к решению системы, можно сделать ее менее громоздкой и более удобной для вычислений. Это достигается за счет элементарных преобразований - таких, что их выполнение никак не меняет конечный ответ. Следует отметить, что некоторые из приведенных элементарных преобразований действительны только для матриц, исходниками которых послужили именно СЛАУ. Вот список этих преобразований:
- Перестановка строк. Очевидно, что если в записи системы поменять порядок уравнений, то на решение это никак не повлияет. Следовательно, в матрице этой системы также можно менять местами строки, не забывая, конечно, про столбец свободных членов.
- Умножение всех элементов строки на некоторый коэффициент. Очень полезно! С помощью него можно сократить большие числа в матрице или убрать нули. Множество решений, как обычно, не изменится, а выполнять дальнейшие операции станет удобнее. Главное, чтобы коэффициент не был равен нулю.
- Удаление строк с пропорциональными коэффициентами. Это отчасти следует из предыдущего пункта. Если две или более строки в матрице имеют пропорциональные коэффициенты, то при умножении/делении одной из строк на коэффициент пропорциональности получаются две (или, опять же, более) абсолютно одинаковые строки, и можно убрать лишние, оставив только одну.
- Удаление нулевой строки. Если в ходе преобразований где-то получилась строка, в которой все элементы, включая свободный член, - ноль, то такую строку можно назвать нулевой и выкинуть из матрицы.
- Прибавление к элементам одной строки элементов другой (по соответствующим столбцам), умноженных на некоторый коэффициент. Самое неочевидное и самое важное преобразование из всех. На нем стоит остановиться поподробнее.
Прибавление строки, умноженной на коэффициент
Для простоты понимания стоит разобрать этот процесс по шагам. Берутся две строки из матрицы:
a11 a12 ... a1n | b1
a21 a22 ... a2n | b2
Допустим, необходимо ко второй прибавить первую, умноженную на коэффициент "-2".
a'21 = a21 + -2×a11
a'22 = a22 + -2×a12
...
a'2n = a2n + -2×a1n
Затем в матрице вторая строка заменяется на новую, а первая остается без изменений.
a11 a12 ... a1n | b1
a'21 a'22 ... a'2n | b2
Необходимо заметить, что коэффициент умножения можно подобрать таким образом, чтобы в результате сложения двух строк один из элементов новой строки был равен нулю. Следовательно, можно получить уравнение в системе, где на одну неизвестную будет меньше. А если получить два таких уравнения, то операцию можно проделать еще раз и получить уравнение, которое будет содержать уже на две неизвестных меньше. А если каждый раз превращать в ноль один коэффициент у всех строк, что стоят ниже исходной, то можно, как по ступенькам, спуститься до самого низа матрицы и получить уравнение с одной неизвестной. Это и называется решить систему методом Гаусса.
В общем виде
Пусть существует система. Она имеет m уравнений и n корней-неизвестных. Записать ее можно следующим образом:

Из коэффициентов системы составляется основная матрица. В расширенную матрицу добавляется столбец свободных членов и для удобства отделяется чертой.
Далее:
- первая строка матрицы умножается на коэффициент k = (-a21/a11);
- первая измененная строка и вторая строка матрицы складываются;
- вместо второй строки в матрицу вставляется результат сложения из предыдущего пункта;
- теперь первый коэффициент в новой второй строке равен a11 × (-a21/a11) + a21 = -a21 + a21 = 0.
Теперь выполняется та же серия преобразований, только участвуют первая и третья строки. Соответственно, в каждом шаге алгоритма элемент a21 заменяется на a31. Потом все повторяется для a41, ... am1. В итоге получается матрица, где в строках [2, m] первый элемент равен нулю. Теперь нужно забыть о строке номер один и выполнить тот же алгоритм, начиная со второй строки:
- коэффициент k = (-a32/a22);
- с "текущей" строкой складывается вторая измененная строка;
- результат сложения подставляется в третью, четвертую и так далее строки, а первая и вторая остаются неизменными;
- в строках [3, m] матрицы уже два первых элемента равны нулю.
Алгоритм надо повторять, пока не появится коэффициент k = (-am,m-1/amm). Это значит, что в последний раз алгоритм выполнялся только для нижнего уравнения. Теперь матрица похожа на треугольник, или имеет ступенчатую форму. В нижней строчке имеется равенство amn × xn = bm. Коэффициент и свободный член известны, и корень выражается через них: xn = bm/amn. Полученный корень подставляется в верхнюю строку, чтобы найти xn-1 = (bm-1 - am-1,n×(bm/amn))÷am-1,n-1. И так далее по аналогии: в каждой следующей строке находится новый корень, и, добравшись до "верха" системы, можно отыскать множество решений [x1, ... xn]. Оно будет единственным.
Когда нет решений
Если в одной из матричных строк все элементы, кроме свободного члена, равны нулю, то уравнение, соответствующее этой строке, выглядит как 0 = b. Оно не имеет решения. И поскольку такое уравнение заключено в систему, то и множество решений всей системы - пустое, то есть она является вырожденной.
Когда решений бесконечное количество
Может получиться так, что в приведенной треугольной матрице нет строк с одним элементом-коэффициентом уравнения, и одним - свободным членом. Есть только такие строки, которые при переписывании имели бы вид уравнения с двумя или более переменными. Значит, у системы имеется бесконечное число решений. В таком случае ответ можно дать в виде общего решения. Как это сделать?
Все переменные в матрице делятся на базисные и свободные. Базисные - это те, которые стоят "с краю" строк в ступенчатой матрице. Остальные - свободные. В общем решении базисные переменные записываются через свободные.
Для удобства матрица сначала переписывается обратно в систему уравнений. Потом в последнем из них, там, где точно осталась только одна базисная переменная, она остается с одной стороны, а все остальное переносится в другую. Так делается для каждого уравнения с одной базисной переменной. Потом в остальные уравнения, там, где это возможно, вместо базисной переменной подставляется полученное для нее выражение. Если в результате опять появилось выражение, содержащее только одну базисную переменную, она оттуда опять выражается, и так далее, пока каждая базисная переменная не будет записана в виде выражения со свободными переменными. Это и есть общее решение СЛАУ.
Можно также найти базисное решение системы - дать свободным переменным любые значения, а потом для этого конкретного случая посчитать значения базисных переменных. Частных решений можно привести бесконечно много.
Решение на конкретных примерах
Вот система уравнений.

Для удобства лучше сразу составить ее матрицу

Известно, что при решении методом Гаусса уравнение, соответствующее первой строке, в конце преобразований останется неизменным. Поэтому выгодней будет, если левый верхний элемент матрицы будет наименьшим - тогда первые элементы остальных строк после операций обратятся в ноль. Значит, в составленной матрице выгодно будет на место первой строки поставить вторую.
Далее необходимо так изменить вторую и третью строки, чтобы первые элементы стали нулями. Для этого надо сложить их с первой, умноженной их на коэффициент:
вторая строка: k = (-a21/a11) = (-3/1) = -3
a'21 = a21 + k×a11 = 3 + (-3)×1 = 0
a'22 = a22 + k×a12 = -1 + (-3)×2 = -7
a'23 = a23 + k×a13 = 1 + (-3)×4 = -11
b'2 = b2 + k×b1 = 12 + (-3)×12 = -24
третья строка: k = (-a31/a11) = (-5/1) = -5
a'31 = a31 + k×a11 = 5 + (-5)×1 = 0
a'32 = a32 + k×a12 = 1 + (-5)×2 = -9
a'33 = a33 + k×a13 = 2 + (-5)×4 = -18
b'3= b3 + k×b1 = 3 + (-5)×12 = -57
Теперь, чтобы не запутаться, необходимо записать матрицу с промежуточными результатами преобразований.

Очевидно, что такую матрицу можно сделать более удобной для восприятия с помощью некоторых операций. Например, из второй строки можно убрать все "минусы", умножая каждый элемент на "-1".
Стоит также заметить, что в третьей строке все элементы кратны трем. Тогда можно сократить строку на это число, умножая каждый элемент на "-1/3" (минус - заодно, чтобы убрать отрицательные значения).

Выглядит гораздо приятнее. Теперь надо оставить в покое первую строку и поработать со второй и третьей. Задача - прибавить к третьей строке вторую, умноженную на такой коэффициент, чтобы элемент a32 стал равен нулю.
k = (-a32/a22) = (-3/7) = -3/7 (если в ходе некоторых преобразований в ответе получилось не целое число, рекомендуется для соблюдения точности вычислений оставить его "как есть", в виде обыкновенной дроби, а уже потом, когда получены ответы, решать, стоит ли округлять и переводить в другую форму записи)
a'32 = a32 + k×a22 = 3 + (-3/7)×7 = 3 + (-3) = 0
a'33 = a33 + k×a23 = 6 + (-3/7)×11 = -9/7
b'3 = b3 + k×b2 = 19 + (-3/7)×24 = -61/7
Снова записывается матрица с новыми значениями.
1 | 2 | 4 | 12 |
0 | 7 | 11 | 24 |
0 | 0 | -9/7 | -61/7 |
Как видно, полученная матрица уже имеет ступенчатый вид. Поэтому дальнейшие преобразования системы по методу Гаусса не требуются. Что здесь можно сделать, так это убрать из третьей строки общий коэффициент "-1/7".

Теперь все красиво. Дело за малым - записать матрицу опять в виде системы уравнений и вычислить корни
x + 2y + 4z = 12 (1)
7y + 11z = 24 (2)
9z = 61 (3)
Тот алгоритм, по которому сейчас будут находиться корни, называется обратным ходом в методе Гаусса. В уравнении (3) содержится значение z:
z = 61/9
Далее возвращаемся ко второму уравнению:
y = (24 - 11×(61/9))/7 = -65/9
И первое уравнение позволяет найти x:
x = (12 - 4z - 2y)/1 = 12 - 4×(61/9) - 2×(-65/9) = -6/9 = -2/3
Такую систему мы имеем право назвать совместной, да еще и определенной, то есть имеющей единственное решение. Ответ записывается в следующей форме:
x1 = -2/3, y = -65/9, z = 61/9.
Пример неопределенной системы
Вариант решения определенной системы методом Гаусса разобран, теперь необходимо рассмотреть случай, если система неопределенная, то есть для нее можно найти бесконечно много решений.
х1 + х2 + х3 + х4 + х5 = 7 (1)
3х1 + 2х2 + х3 + х4 - 3х5 = -2 (2)
х2 + 2х3 + 2х4 + 6х5 = 23 (3)
5х1 + 4х2 + 3х3 + 3х4 - х5 = 12 (4)
Сам вид системы уже настораживает, потому что количество неизвестных n = 5, а ранг матрицы системы уже точно меньше этого числа, потому что количество строк m = 4, то есть наибольший порядок определителя-квадрата - 4. Значит, решений существует бесконечное множество, и надо искать его общий вид. Метод Гаусса для линейных уравнений позволяет это сделать.
Сначала, как обычно, составляется расширенная матрица.

Вторая строка: коэффициент k = (-a21/a11) = -3. В третьей строке первый элемент - еще до преобразований, поэтому не надо ничего трогать, надо оставить как есть. Четвертая строка: k = (-а41/а11) = -5
Умножив элементы первой строки на каждый их коэффициентов по очереди и сложив их с нужными строками, получаем матрицу следующего вида:

Как можно видеть, вторая, третья и четвертая строки состоят из элементов, пропорциональных друг другу. Вторая и четвертая вообще одинаковые, поэтому одну из них можно убрать сразу, а оставшуюся умножить на коэффициент "-1" и получить строку номер 3. И опять из двух одинаковых строк оставить одну.
Получилась такая матрица. Пока еще не записана система, нужно здесь определить базисные переменные - стоящие при коэффициентах a11 = 1 и a22 = 1, и свободные - все остальные.

Во втором уравнении есть только одна базисная переменная - x2. Значит, ее можно выразить оттуда, записав через переменные x3, x4, x5, являющиеся свободными.
Подставляем полученное выражение в первое уравнение.
Получилось уравнение, в котором единственная базисная переменная - x1. Проделаем с ней то же, что и с x2.
Все базисные переменные, которых две, выражены через три свободные, теперь можно записывать ответ в общем виде.

Также можно указать одно из частных решений системы. Для таких случаев в качестве значений для свободных переменных выбирают, как правило, нули. Тогда ответом будет:
-16, 23, 0, 0, 0.
Пример несовместной системы
Решение несовместных систем уравнений методом Гаусса - самое быстрое. Оно заканчивается сразу же, как только на одном из этапов получается уравнение, не имеющее решения. То есть этап с вычислением корней, достаточно долгий и муторный, отпадает. Рассматривается следующая система:
x + y - z = 0 (1)
2x - y - z = -2 (2)
4x + y - 3z = 5 (3)
Как обычно, составляется матрица:
1 | 1 | -1 | 0 |
2 | -1 | -1 | -2 |
4 | 1 | -3 | 5 |
И приводится к ступенчатому виду:
k1 = -2k2 = -4
1 | 1 | -1 | 0 |
0 | -3 | 1 | -2 |
0 | 0 | 0 | 7 |
После первого же преобразования в третьей строке содержится уравнение вида
0 = 7,
не имеющее решения. Следовательно, система несовместна, и ответом будет пустое множество.
Преимущества и недостатки метода
Если выбирать, каким методом решать СЛАУ на бумаге ручкой, то метод, который был рассмотрен в этой статье, выглядит наиболее привлекательно. В элементарных преобразованиях гораздо труднее запутаться, чем в том случается, если приходится искать вручную определитель или какую-нибудь хитрую обратную матрицу. Однако, если использовать программы для работы с данными такого типа, например, электронные таблицы, то оказывается, что в таких программах уже заложены алгоритмы вычисления основных параметров матриц - определитель, миноры, обратная и транспонированная матрицы и так далее. А если быть уверенным в том, что машина посчитает эти значения сама и не ошибется, целесообразней использовать уже матричный метод или формул Крамера, потому что их применение начинается и заканчивается вычислением определителей и обратными матрицами.
Применение
Поскольку решение методом Гаусса представляет из себя алгоритм, а матрица - это, фактически, двумерный массив, его можно использовать при программировании. Но поскольку статья позиционирует себя, как руководство "для чайников", следует сказать, что самое простое, куда метод можно запихнуть - это электронные таблицы, например, Excel. Опять же, всякие СЛАУ, занесенные в таблицу в виде матрицы, Excel будет рассматривать как двумерный массив. А для операций с ними существует множество приятных команд: сложение (складывать можно только матрицы одинаковых размеров!), умножение на число, перемножение матриц (также с определенными ограничениями), нахождение обратной и транспонированной матриц и, самое главное, вычисление определителя. Если это трудоемкое занятие заменить одной командой, можно гораздо быстрее определять ранг матрицы и, следовательно, устанавливать ее совместность или несовместность.