Линейная алгебра 1 Линейные уравнения и системы

Введение в линейную алгебру 1 Линейные уравнения и системы

Изображение из Städel Museum

Системы линейных уравнений

Предисловие

Это первое дополнение к серии статей о основах линейной алгебры, которая является основой математики машинного обучения. Эта статья лучше всего служит читателям, если читается вместе с книгой “Линейная алгебра и ее приложения” Дэвида С. Лэя, Стивена Р. Лэя и Джуди Дж. Макдоналд. Рассматривайте эту серию как внешний источник сопровождения.

Через эти статьи я надеюсь укрепить свое понимание этих основных понятий, и, если возможно, предоставить дополнительную ясность другим с помощью интуитивного подхода к изучению математики. Если есть ошибки или возможности для дополнительного разъяснения, пожалуйста, поделитесь, и я могу внести необходимые изменения.

Основы

Линейные уравнения и системы линейных уравнений имеют различные прикладные применения в областях финансов, инженерии, химии, компьютерной науки, статистики, физики и т. д. В химии линейные уравнения используются для балансировки химических реакций и вычисления количества реагентов и продуктов. Этот угловой камень линейной алгебры также используется в физике, где линейные уравнения используются в кинематике и термодинамике для описания движения объектов, помогая вычислять расстояния, скорости и ускорения, а также моделировать перенос тепла и энергии в физических системах соответственно. Финансовая сфера полагается на линейные уравнения и системы для составления бюджета и анализа портфеля, в то время как инженеры могут использовать те же инструменты для проведения структурного анализа для моделирования сил и напряжений в зданиях. Линейная алгебра повсеместна, и каждый может оценить ее в некоторой степени.

Линейные уравнения

Линейное уравнение – это уравнение с одной или несколькими переменными, где показатель, к которому возведена переменная, должен быть равен единице. Оно может быть записано в виде: a₁x₁ + a₂x₂ + … + 2ᵣxᵣ = b. Значения [a₁, a₁, …, aᵣ] и b называются коэффициентами линейного уравнения.

Примеры линейных уравнений: 2x + 5y = 10, 6x = 18, 7v + 8w + 0x + 2y + 3z = 15 и 3x₁ + 4x₂ + 5x₃+9x₄ + 10x₇ = 3.

Примеры нелинейных уравнений: 2x² + 6x + 5 = 2; это уравнение является квадратным* уравнением. Другим примером нелинейного уравнения может быть 7x₁ + 3x₂ = x₁* y₁; причина этого становится ясной, когда вы графикуете это уравнение, оно может быть преобразовано для образования рациональной функции y = 7x / x – 3, которая имеет кривую форму в отличие от линейной.

Рассмотрим линейное уравнение 2x + 5y = 10. Ниже приведена диаграмма, иллюстрирующая графическое представление линейного уравнения, вы увидите, что это линия. Это становится более очевидным, если вспомнить уравнение прямой: y = mx + b, где m = наклон и b = y-перехват. Линейное уравнение может быть переупорядочено, как показано ниже, чтобы принять эту форму.

Можно сделать следующий вывод: все точки (x, y), которые лежат на прямой, являются решениями уравнения 2x + 5y = 10. Например, предположим, мы выбираем точку пересечения с осью x (5, 0) и подставляем значения x и y в соответствующие позиции в уравнении. 2(5) + 5(0) = 10. Любая (x, y) точка на прямой может быть подставлена в уравнение, и равенство будет выполняться. Мы можем обобщить это положение, сформулировав следующее правило:

Множество решений в ℝ²* для линейного уравнения с двумя переменными, ax + by = c, может быть представлено в виде прямой.

Обратите внимание, что у этого уравнения существует бесконечное количество решений, которые охватывают всю ℝ². Мы рассмотрим количество решений позже.

Этот же основной концепт переносится на пространства более высоких размерностей, обозначаемые как ℝⁿ, например, ℝ³, в котором линия становится плоскостью из-за добавления третьей переменной.

Системы линейных уравнений

Система линейных уравнений – это набор одного или нескольких линейных уравнений с общими переменными. Пример:

6x + 2y = 4

2x + 4y = 8

Решение системы линейных уравнений определяется как значения (s₁, s₂, …, sᵣ), которые делают каждое уравнение истинным при подстановке их в соответствующие переменные. В случае приведенной выше системы решение будет (0, 2), потому что при подстановке (0, 2) в систему оба уравнения оказываются истинными.

Решения линейной системы

Каковы графические последствия решения линейной системы? Каковы различные случаи числа решений для линейной системы? В этом разделе каждый из трех возможных случаев будет рассмотрен более подробно. Они следующие:

  1. Уникальное решение
  2. Нет решения
  3. Бесконечное количество решений

Уникальное решение: В случае линейной системы с двумя переменными, как в примере выше, решение является точкой пересечения. Почему? Решение – это упорядоченная пара, в которой должны быть удовлетворены оба уравнения, если такая пара не существует, это означает, что линии никогда не пересекаются. Это пример уникального решения. Существует только одно решение, которое удовлетворяет все уравнения в линейной системе.

Нет решения: Рассмотрим случай отсутствия решения. Какой это может иметь смысл в контексте линейной системы с двумя переменными? В каких сценариях набор линий никогда не пересечется? Один случай – если они являются параллельными. В случае линейной системы, где линии параллельны, у системы линейных уравнений не будет решений. Другой случай – когда некоторые линии могут пересекаться с другими, но нет общей точки пересечения для всех линий.

Бесконечное количество решений: Последний случай линейной системы – это существование бесконечного количества решений. Когда может быть бесконечное количество решений для линейной системы с двумя переменными? Если линии одинаковы, то существует бесконечное количество точек пересечения, потому что они накладываются друг на друга, и таким образом существует бесконечное количество решений. Рассмотрим следующую линейную систему:

6x + 3y = 18

2x + y = 6

Хотя коэффициенты могут отличаться, эти линии на самом деле идентичны! Если вы поделите каждый коэффициент первого уравнения на 3, полученное уравнение будет 2x + y = 6.

Визуализация количества решений для линейной системы меняется по мере увеличения числа переменных. На рисунке ниже показаны возможные диаграммы всех трех случаев решений для линейной системы с тремя переменными. Что угодно после трех измерений становится сложно для человеческого мозга визуализировать, но те же правила действуют! Независимо от количества переменных, все линейные системы имеют либо нет решений, либо одно решение, либо бесконечное количество решений.

Эта диаграмма была адаптирована из src.

Матричная нотация

По мере усложнения линейных уравнений запись может стать неудобной. Важно, чтобы информация о линейной системе была сжата для удобства манипулирования и работы с ней, поэтому вместо набора уравнений часто используется матричная нотация. Матрица коэффициентов – это тип матрицы, исключающей коэффициент b из каждого уравнения. Присоединенная матрица включает коэффициент b, поэтому она имеет на одну колонку больше, чем матрица коэффициентов.

Размер, также называемый порядком, матрицы позволяет нам определить, сколько строк и столбцов содержит матрица. Матрица размером m x n представляет собой матрицу с m строками и n столбцами. Количество строк соответствует количеству линейных уравнений в системе, а количество столбцов показывает, сколько переменных присутствует. Обратите внимание, что количество строк должно предшествовать количеству столбцов, так как порядок не может быть поменян.

Решение линейной системы

Существует систематический подход к определению имеет ли линейная система решение, и если да, то является ли оно единственным или бесконечным, и оттуда получить решения. Решение линейной системы можно выполнить с использованием линейных уравнений в их исходной форме или с использованием матрицы, хотя рекомендуется использовать матрицу, поскольку обозначение более чистое и компактное. Однако важно хорошо знать оба метода, так как они дополнительно раскрывают механизмы друг друга.

Внизу приведен пошаговый процесс решения системы уравнений без использования матриц. Основная идея состоит в том, чтобы создать новые уравнения, умножая уже существующие, чтобы получить идентичные уравнения, которые затем могут быть сложены или вычтены из другого уравнения для исключения одной переменной. Этот процесс затем повторяется до тех пор, пока мы не удалим достаточное количество неизвестных из системы для того, чтобы сможем найти значение одной переменной, а затем использовать обратную подстановку для нахождения значения других переменных. В конце нужно проверить, удовлетворяет ли найденное решение системе уравнений.

Операции над строками

Применяемые ранее шаги можно применить и к матричному способу решения линейной системы. Обратите внимание, как переменные, которые исключены, обозначаются внутри матрицы после каждого преобразования. Прежде чем перейти к этому, давайте определим некоторые операции над строками. Две из них фактически параллельны операциям, которые мы применяли ранее.

  1. Замена: “замена строки суммой самой с собой и другой строки.”*
  2. Перестановка: “обмен двух строк.”*
  3. Масштабирование: “умножение всех элементов строки на ненулевую константу.”*

Давайте вернемся к той же самой линейной системе, но на этот раз используя матрицы и операции над строками.

Обратите внимание, что я использовал точно такие же операции и коэффициенты масштабирования, что и в методе линейных уравнений. Как неудивительно, мы получаем те же самые уравнения, что и ранее. Также обратите внимание на треугольную формацию в левом нижнем углу конечной матрицы. Такой шаблон возникает из-за нулевых элементов, которые являются маркерами исключенной переменной. Каждая исключенная переменная приближает нас к определению уравнения, которое можно легко решить, что в свою очередь позволяет продолжить решение всей системы. Мы вернемся к этому явлению и я предоставлю более формальное определение в следующей главе.

Резюме

В этой главе мы узнали:

  • Линейные уравнения: уравнение с одной или несколькими переменными, где степень уравнения должна быть равна 1.
  • Системы линейных уравнений: набор линейных уравнений.
  • Решения системы одного или нескольких линейных уравнений: линейная система может не иметь решений, иметь единственное решение или бесконечное количество решений.
  • Обозначение матрицы: прямоугольный массив, который используется для компактного представления линейной системы.
  • Операции над строками: операции замены, перестановки и масштабирования позволяют преобразовать матрицу так, чтобы было исключено достаточное количество неизвестных переменных для решения системы.
  • Решение линейной системы: систематический способ найти a) существуют ли решения для данной линейной системы и b) если решение(я) существуют, то каковы их точные значения.

Примечания

* Если не указано иное, все изображения автора статьи.

* Как примечание: слово “квадратное” происходит от латинского слова “quadratus”, являющегося причастием прошедшего времени от латинского слова “quadrare”, что означает “сделать квадрат”.; что отражает его степень! [ссылка]

*ℝ² – это пространство всех возможных упорядоченных пар (x, y) на числовой прямой, представленное двумерной плоскостью. ℝ² охватывает всю совокупность действительных чисел, а множество действительных чисел является несчетно бесконечным, что означает, что пространство ℝ² также является бесконечным.

*Цитата для операций над строками [исходный код]