Лекция 2. SQL, Redis Flashcards

Question

Как получить текущую дату и время в SQL?

Answer 1

SELECT now(), current_date, clock_timestamp()

Answer 2

DELETE – удаляет записи по одной, сканируя таблицу. Операция типа DML. TRUNCATE – это DDL-операция, позволяет удалять мгновенно все данные из одной или нескольких таблиц, сохраняя их структуру. Работает быстрее, чем DELETE

Answer 3

Primary Key – уникальный ключ для идентификации каждой записи в таблице. - Идентифицирует строку в таблице - Обязан быть уникальным - Запрещены NOT NULL - Только один на таблицу - Индекс создается автоматически Foreign Key – устанавливает связь между текущей таблицей и столбцами в другой таблице. Гарантирует согласованность данных между связанными таблицами. - Связывает таблицы между собой - Может повторяться - Разрешены NULL, если связь необязательна - Может быть несколько в одной таблице - Индекс нужно создавать вручную

Answer 4

Это ограничения, которые накладываются на столбцы и таблицы для обеспечения точности, целостности и надежности данных

Answer 5

Гарантирует, что все значения в столбце являются уникальными

Answer 6

UUID проигрывает классическому SERIAL по трем основным причинам: **размер**, **сортировка** и **индексация** 1. Объемы данных - SERIAL занимает всего 4 байта - UUID занимает 16 байт 2. Фрагментация индекса - SERIAL генерирует значения последовательно - UUID генерируется случайно 3. Нагрузка на CPU Сравнивать два целых числа (SERIAL) — это элементарная операция для процессора. Сравнивать 128-битные UUID — задача более ресурсоемкая, что замедляет операции `JOIN` и `ORDER BY`.

Answer 7

INNER JOIN – возвращает строки, которые имеют соответствующие значения в обеих объединяемых таблицах OUTER JOIN (LEFT, RIGHT, FULL) – включает все строки из одной таблицы или обеих таблиц, заполняя отсутствующие блоки значениями NULL

Answer 8

DeadTuple – (мертвый кортеж) относится к стокам данных, которые были удалены или обновлены, но все еще занимают место в таблице до тех пор, пока не будет выполнена команда VACUUM Vacuum – это "мусорщик", который проходит по таблице и ище Dead Tuples. Просто помечает место, занятое мертвыми строками, как "свободное"

Answer 9

С помощью команды pg_stat_activity. **Зачем проверять?** – У каждой базы есть лимит `max_connections`. Если количество коннектов приблизится к нему, новые пользователи не смогут подключиться

Answer 10

Для получения мгновенного, но приблизительного значения используйте системный каталог `pg_class`. 1. Быстрый – Через статистику Этот запрос берет данные из планировщика. Они обновляются при каждом `ANALYZE` или `AUTOVACUUM` ```sql SELECT reltuples AS estimate FROM pg_class WHERE relname = 'имя_вашей_таблицы'; ``` 2. Более точный способ (через системное представление) Этот вариант обращается к статистике схемы, что часто удобнее ```sql SELECT n_live_tup FROM pg_stat_user_tables WHERE relname = 'имя_вашей_таблицы'; ```

Answer 11

Основные этапы и методы оптимизации: 1.Анализ запроса (EXPLAIN ANALYZE): - Используйте EXPLAIN (ANALYZE, BUFFERS) query; - Ищите узлы с наибольшим временем (actual time) и стоимостью (cost). - Проверьте, не происходит ли полное сканирование таблицы (Seq Scan) там, где должен работать индекс. 2. Индексация: - Создавайте индексы на столбцы, используемые в WHERE, JOIN и ORDER BY. - Используйте B-tree для точного поиска и диапазонов, GIN — для JSONB и полнотекстового поиска. - Пример: CREATE INDEX idx_name ON table_name(column_name);. 3. Оптимизация SQL-кода: - Избегайте SELECT *, указывайте только нужные столбцы. - Избегайте функций в условиях WHERE, так как это мешает использованию индексов. - Используйте LIMIT для ограничения выборки. - Заменяйте сложные подзапросы на соединения (JOIN) или временные таблицы при необходимости. 4. Обслуживание базы данных: - Регулярно запускайте ANALYZE для обновления статистики, чтобы планировщик выбирал оптимальный путь. - Убедитесь, что autovacuum включен и работает корректно, чтобы предотвратить раздувание таблиц (bloat). 5. Настройка конфигурации (postgresql.conf): - work_mem: Увеличьте для сложных запросов с сортировкой или хэш-соединениями. - random_page_cost: Снизьте до 1.1–1.5, если используете SSD (по умолчанию 4.0 для HDD), чтобы планировщик чаще использовал индексы. - effective_cache_size: Установите значение, отражающее объем памяти, доступный для кэширования (обычно 50-75% от общего объема RAM). 6. Мониторинг: - Используйте pg_stat_statements для поиска самых медленных и частых запросов. - Анализируйте логи медленных запросов (log_min_duration_statement)

Answer 12

CHAR выигрывает в специфических сценариях благодаря **предсказуемости** и **архитектуре** хранения. Вот основные причины: 1. Фиксированная длина = Скорость СУБД точно знает, сколько байт отведено под каждую строку, что упрощает расчет смещения при чтении данных с диска 2. Избежание "раздувания" (Row Overheads) CHAR не хранит дополнительные 1 или 4 байта, чтобы записать длину строки 3. Предотвращение фрагментации (в некоторых СУБД) Использование CHAR в таблицах с фиксированной длиной строки позволяет избежать фрагментации файлов 4. Наглядность и валидация CHAR(10) – это своего рода constraint. Он гарантирует, что данные будут определенного формата

Answer 13

SELECT * FROM Shops WHERE COUNT(orders) > 100

Answer 14

Возникает в контексте выполнения запросов к БД, когда при получении связанных данных, несколько раз выполняются дополнительные запросы к БД для каждой записи или объекта, полученного в первоначальном запросе. Это приводит к избыточному количеству запросов и снижению производительности приложения. Решение проблемы N+1 в PostgreSQL: 1. Использование JOIN – Вы можете объединить таблицы с помощью оператора JOIN в одном запросе, чтобы избежать дополнительных запросов. 2. Использование подзапросов (Subqueries) 3. Использование оконных функций (Window Function) 4. Использование CTE (Common Table Expressions)

Answer 15

Этот метод позволяет строить индексы без блокировки записи (INSERT, UPDATE, DELETE) в таблицу, обеспечивая доступность данных для приложений. CREATE INDEX CONCURRENTLY имя_индекса ON имя_таблицы (столбец);

Answer 16

К счастью, вы можете сначала выполнить всю тяжелую работу, используя CREATE UNIQUE INDEX CONCURRENTLY , а затем использовать уникальный индекс в качестве первичного ключа, что является быстрой операцией. CREATE UNIQUE INDEX CONCURRENTLY items_pk ON items (id); -- занимает много времени, но не блокирует запросы ALTER TABLE items ADD CONSTRAINT items_pk PRIMARY KEY USING INDEX items_pk; -- блокирует запросы, но ненадолго Разбиение создания первичного ключа на два этапа практически не отражается на пользователе.

Answer 17

pg_advisory_lock – это механизм блокировки, предоставляемый Системой Управления Базами Данных PostgreSQL (PostgreSQL DBMS), который позволяет приложениям управлять собственными пользовательскими блокировками на уровне базы данных. Он полезен в сценариях, где вам нужно координировать доступ к ресурсам или операциям в многопользовательской среде.

Answer 18

Bitmap Index в EXPLAIN (обычно в PostgreSQL) — это метод эффективного поиска, при котором база данных создает битовую карту (0 или 1 для каждой строки) на основе индекса, а затем использует ее для выборки данных. Он состоит из двух этапов: Bitmap Index Scan (создание карты) и Bitmap Heap Scan (чтение строк из таблицы), что позволяет ускорить запросы с множественными условиями. Как это работает в плане выполнения (EXPLAIN): 1.Bitmap Index Scan (сканирование индекса): База сканирует индекс (например, по колонке с низкой кардинальностью) и создает в оперативной памяти битовый массив, где 1 означает, что строка соответствует условию, а 0 — нет. 2. BitmapAnd / BitmapOr (объединение): Если в запросе несколько условий (например, AND или OR), база данных выполняет побитовые операции над несколькими картами, получая итоговый массив. 3. Bitmap Heap Scan (сканирование кучи): Полученная битовая карта используется для обращения к таблице. Важно, что данные считываются не подряд, а в упорядоченном по физическому расположению (на страницах) виде, что уменьшает количество случайных операций ввода-вывода (random I/O). 4. Recheck Cond (перепроверка): Поскольку битовая карта указывает на страницу данных, а не на конкретную строку, Bitmap Heap Scan часто выполняет перепроверку условий 5. Recheck Cond для строк внутри страницы, чтобы исключить ложные срабатывания.

Answer 19

Нормальные формы (Normal Forms) - это система правил и стандартов, которые определяют, как организовать структуру реляционных баз данных, чтобы обеспечить целостность данных и уменьшить избыточность информации. 1. Первая нормальная форма (1NF): 2. Вторая нормальная форма (2NF): 3. Третья нормальная форма (3NF):

Answer 20

–Что это: Логические представления данных, основанные на результатах запроса SQL. Представления не хранят данные сами по себе, а предоставляют способ доступа к данным, хранящимся в одной или нескольких таблицах. – Зачем нужны: Упрощают сложные запросы, обеспечивают уровень абстракции для безопасности и удобства. ```sql CREATE VIEW ActiveUsers AS SELECT user_id, username FROM users WHERE status = 'active'; ```sql

Answer 21

– Это предварительно скомпилированный набор SQL-операторов, хранящийся на сервере базы данных.. Они могут включать SQL запросы и другие логические конструкции (циклы, условия). – Зачем нужны: Улучшают производительность, повторное использование кода, упрощают управление транзакциями и обеспечивают безопасность. ```sql CREATE PROCEDURE UpdateUserStatus(IN userId INT, IN newStatus VARCHAR(20)) BEGIN UPDATE users SET status = newStatus WHERE id = userId; END; ```

Answer 22

– Что это: Автоматические действия, выполняемые при определённых событиях в таблице, таких как вставка, обновление или удаление строк. – Зачем нужны: Поддерживают целостность данных, автоматизируют задачи, выполняют аудит изменений. – Пример: ```sql CREATE TRIGGER BeforeInsertUser BEFORE INSERT ON users FOR EACH ROW BEGIN SET NEW.created_at = NOW(); END; ```

Answer 23

1. `PRIMARY KEY` (Первичный ключ): 2. `UNIQUE` (Уникальность): 3. `NOT NULL` (Не пустое значение): 4. `FOREIGN KEY` (Внешний ключ): 5. `CHECK` (Проверка): 6. `DEFAULT` (Значение по умолчанию):

Answer 24

Связи **Один-к-одному (One-to-One):** - Описание: Каждая запись в одной таблице связана с одной и только одной записью в другой таблице. **Один-ко-многим (One-to-Many):** - Описание: Каждая запись в одной таблице связана с одной или более записями в другой таблице. Таблица с одной стороны связи называется "родительской" таблицей, а с другой стороны - "дочерней" таблицей. **Многие-ко-многим (Many-to-Many):** - Описание: Множество записей в одной таблице связано с множеством записей в другой таблице через промежуточную таблицу, называемую "связующей" или "промежуточной" таблицей. **Самосвязь (Self-Referencing):** - Описание: Таблица может быть связана сама с собой. Это используется, когда сущность имеет отношение к другим сущностям того же типа. **Композиция (Composition):** - Описание: В данном случае, одна сущность является частью другой и не имеет самостоятельного смысла без родительской сущности. **Агрегация (Aggregation):** - Описание: Похожа на композицию, но агрегированный объект имеет собственную сущность и может существовать независимо от родительской сущности.

Answer 25

— это механизм, который автоматически удаляет связанные записи в других таблицах при удалении записи в основной таблице. Этот механизм используется для поддержания целостности данных и избежания "висячих" ссылок, то есть ситуаций, когда данные в одной таблице ссылаются на несуществующие данные в другой таблице.

Answer 26

— это метод разбиения большого результирующего набора данных на более мелкие, управляемые части («страницы»), что повышает производительность запросов и улучшает пользовательский опыт.

Answer 27

Работает с помощью ключевых слов `OFFSET` и `LIMIT`. Например, размер одной страницы 10 элементов и нам нужна вторая страница: ```sql select * from users order by `id` asc limit 10 offset 10; ``` Распространенной проблемой при offset-пагинации является дублирование или отсутствие контента, особенно для наборов данных с высокой частотой записи. Эта проблема возникает, когда добавляются или удаляются одна или несколько записей на предыдущей странице.

Answer 28

```sql select * from users where `id` > 10 order by `id` asc limit 10; ``` **Использует** `WHERE` вместо `OFFSET`, чтобы пропустить элементы с прошлых страниц. В условии `WHERE` указываются значения последнего элемента на прошлой странице. Пример: Курсорная пагинация **работает быстрее, чем offset**-пагинация за счет того, что offset сканирует все предыдущие данные. Это означает, что при смещении в 100 000 записей БД по-прежнему будет сканировать эти 100 000 записей. А cursor-пагинация можно сразу перейти к нужной записи, при условии, что настроен индекс для поля в order by. **Ограничения курсорной пагинации:** - Не поддерживает нумерацию страниц - Необходим индекс для поля в `order by` - Поля в `order by` должны быть уникальны. Если сортировка по не уникальным полям, можно добавить в сравнение поле `id` или `created_at`:

Answer 29

**INNER JOIN:** - Описание: Возвращает строки, которые имеют соответствующие значения в обеих объединяемых таблицах. **LEFT JOIN (или LEFT OUTER JOIN):** - Описание: Возвращает все строки из левой таблицы и соответствующие строки из правой таблицы. Если в правой таблице нет соответствия, то будут возвращены NULL-значения. **RIGHT JOIN (или RIGHT OUTER JOIN):** - Описание: Возвращает все строки из правой таблицы и соответствующие строки из левой таблицы. Если в левой таблице нет соответствия, то будут возвращены NULL-значения. **FULL JOIN (или FULL OUTER JOIN):** - Описание: Возвращает все строки из обеих таблиц. Если нет соответствующего значения в одной из таблиц, будут возвращены NULL-значения. **CROSS JOIN (или CARTESIAN JOIN):** - Описание: Возвращает декартово произведение строк из двух таблиц. То есть каждая строка из первой таблицы объединяется с каждой строкой из второй таблицы.

Answer 30

Также известное как WITH-запрос, представляет собой временное именованное подзапросное выражение, которое можно использовать внутри других SQL-запросов. CTE обеспечивает чистоту и читаемость SQL-запросов, делая их более структурированными и понятными.

Answer 31

Оконная функция (window function) в SQL - это мощный инструмент для анализа данных, который позволяет выполнять вычисления на подмножествах результирующего набора строк, называемых "окнами" (windows), в пределах определенного порядка. Оконные функции позволяют вычислять агрегатные функции, ранги, и другие операции на наборе строк, сгруппированных и упорядоченных по определенным столбцам.

Answer 32

Основные компоненты плана выполнения - **Seq Scan (Sequential Scan)**: - **Index Scan**: - **Bitmap Index Scan** и **Bitmap Heap Scan**: - **Nested Loop**: - **Hash Join**: - **Merge Join**: - **Sort**: - **Aggregate**:

Answer 33

— это показатель того, насколько хорошо индекс помогает сузить круг возможных строк, которые нужно проверить при выполнении запроса. Другими словами, селективность определяет, насколько "выборочным" будет запрос, когда используется индекс.

Answer 34

— это такой индекс, который содержит все данные, необходимые для выполнения запроса. Это значит, что база данных может получить все нужные данные только из индекса, не обращаясь к самой таблице. Это позволяет значительно ускорить запросы, потому что обращение к индексу быстрее, чем к основной таблице.

Answer 35

— это механизмы управления одновременным доступом к данным, которые ограничивают доступ к строкам или таблицам базы данных (БД) во время выполнения транзакций. Они гарантируют целостность и согласованность данных (ACID), предотвращая одновременное изменение одной записи разными пользователями. Данные, на которые наложена блокировка, недоступны для чтения или записи другими пользователями до её снятия. Блокировки строк (Row Locks) **Блокировки строк** применяются к отдельным строкам в таблице. Они позволяют более гранулярно контролировать доступ к данным, что улучшает параллелизм и производительность при работе с большим количеством транзакций. Блокировки таблиц (Table Locks) **Блокировки таблиц** применяются ко всей таблице. Они используются для операций, которые затрагивают множество строк или структуру таблицы, таких как добавление индексов или изменения схемы.

Answer 36

**Блокировки таблиц** применяются ко всей таблице. Они используются для операций, которые затрагивают множество строк или структуру таблицы, таких как добавление индексов или изменения схемы. **Виды блокировок таблиц:** 1. **Access Share Lock**: - **Описание**: Позволяет другим транзакциям также устанавливать access share-блокировки. 2. **Row Share Lock**: - **Описание**: Блокирует exclusive-блокировки, но позволяет shared-блокировки. 3. **Row Exclusive Lock**: - **Описание**: Блокирует row share и exclusive блокировки, но позволяет access share блокировки. 4. **Share Update Exclusive:** 5. **Share Lock**: - **Описание**: Позволяет другим транзакциям устанавливать только access share блокировки. 6. **Share Row Exclusive Lock**: - **Описание**: Блокирует другие share и exclusive блокировки. 7. **Exclusive Lock**: - **Описание**: Полностью блокирует таблицу для других операций. 8. **Access Exclusive Lock**: - **Описание**: Самая строгая блокировка, блокирует все другие блокировки.

Answer 37

— это ситуация, когда две или более транзакции бесконечно ожидают друг от друга освобождения блокировок на ресурсы (таблицы, строки), удерживая свои собственные.

Answer 38

Механизм SELECT FOR UPDATE в базах данных PostgreSQL используется для управления конкурентным доступом к данным. Этот механизм позволяет блокировать строки, которые будут обновляться, предотвращая возможные конфликты при параллельном доступе к тем же данным.

Answer 39

Транзакция в контексте баз данных представляет собой логическую единицу работы, состоящую из одного или нескольких SQL-запросов. Транзакция начинается с начала выполнения первого запроса и заканчивается успешным завершением (фиксацией | COMMIT) или откатом (отменой | ROLLBACK) всех внесенных изменений в базу данных после выполнения последнего запроса. Транзакции обеспечивают целостность данных и позволяют избегать потери или несогласованности данных при одновременном доступе нескольких пользователей к базе данных.

Answer 40

1. **Атомарность (Atomicity)**: Транзакция считается атомарной, что означает, что она выполняется как единое целое. Все изменения в базе данных либо выполняются полностью, либо не выполняются вообще. Если одна часть транзакции завершается неудачно, все изменения отменяются (откат), и база днных остается в состоянии, аналогичном тому, как если бы транзакция вообще не выполнялась. 2. **Согласованность (Consistency)**: Транзакция должна приводить базу данных из одного согласованного состояния в другое с соблюдением всех целостностных ограничений и правил, заданных в базе данных. 3. **Изолированность (Isolation)**: Транзакции должны выполняться в изоляции друг от друга, так что результат одной транзакции не виден другим транзакциям до тех пор, пока первая не завершится. Это обеспечивает предотвращение конфликтов при одновременном доступе к данным нескольких пользователей. 4. **Долговечность (Durability)**: После успешного завершения транзакции ее результаты должны сохраняться даже в случае сбоя системы. Данные должны быть сохранены на постоянной основе и доступны после восстановления системы.

Answer 41

– это явление, которое может возникнуть при использовании уровня изоляции Read Committed в базе данных. Уровень изоляции Read Committed позволяет одной транзакции читать только фиксированные (зафиксированные) значения данных, но эти значения могут изменяться другими транзакциями. Гонка транзакций возникает, когда несколько транзакций конфликтуют из-за чтения и обновления одних и тех же данных, и это может привести к нежелательным результатам.

Answer 42

Вот как это может происходить: 1. **Транзакция A читает данные**: Транзакция A начинает чтение данных из базы данных, например, выбирая значение столбца "X". 2. **Транзакция B обновляет данные**: В то время как транзакция A еще не завершилась, транзакция B выполняет обновление данных, изменяя значение столбца "X". 3. **Транзакция A завершается**: Транзакция A завершает свою работу, но она видит измененное значение столбца "X", которое было сделано транзакцией B. 4. **Нежелательные результаты**: Таким образом, транзакция A видит несогласованные данные, которые могут быть неправильными или недействительными для ее цели. > Это называется "гонкой транзакций", потому что две транзакции "соревнуются" за доступ к данным, и результаты могут быть неопределенными или некорректными. Гонки транзакций могут приводить к проблемам с целостностью данных и нежелательным последствиям в вашем приложении. >

Answer 43

Уровни изоляции транзакций определяют, как взаимодействуют между собой транзакции при одновременном доступе к данным в реляционных базах данных. Они определяют уровень видимости и блокировки данных между транзакциями. –**Read Uncommitted (Чтение неподтвержденных данных)**: –**Read Committed (Чтение подтвержденных данных) default in PG**: –**Repeatable Read (Повторяемое чтение)**: –**Serializable (Сериализуемое выполнение)**:

Answer 44

1. **Грязное чтение (Dirty Read)**: - Проблема: Грязное чтение возникает, когда одна транзакция читает данные, которые были временно изменены другой транзакцией и ещё не были подтверждены (зафиксированы). 2. **Неповторяющееся чтение (Non-Repeatable Read)**: - Проблема: Неповторяющееся чтение возникает, когда одна и та же транзакция читает данные дважды и видит разные значения во втором чтении из-за изменений, внесенных другой транзакцией. 3. **Потерянное обновление (Lost Update)**: - Проблема: Потерянное обновление происходит, когда две транзакции одновременно читают и обновляют одни и те же данные, и обновление одной из них перезаписывает изменения, внесенные другой. 4. **Фантомное чтение (Phantom Read)**: - Проблема: Фантомное чтение возникает, когда одна транзакция выполняет запрос, который возвращает набор данных, и затем другая транзакция вставляет, обновляет или удаляет данные, что приводит к изменению результата первого запроса.

Answer 45

**MVCC (Multi-Version Concurrency Control)** – это механизм управления параллельным доступом к данным в базе данных, который широко используется в PostgreSQL и других СУБД для поддержки одновременных транзакций. MVCC позволяет разным транзакциям видеть базу данных в разных “версиях” (или состояниях), что обеспечивает высокую степень изоляции и консистентности данных. Как это работает: 1. **Создание версий данных**: Когда транзакция вносит изменения в базу данных, PostgreSQL не изменяет существующие строки, а создает новые версии строк с обновленными данными. Это позволяет другим транзакциям видеть старые версии данных, пока изменения не будут окончательно зафиксированы. 2. **Версионирование по времени**: Каждая версия строки имеет информацию о времени начала и окончания её действия. Это позволяет транзакциям видеть данные в соответствии с моментом времени начала транзакции, что обеспечивает изоляцию. 3. **Удаление устаревших данных**: PostgreSQL может автоматически удалять устаревшие версии данных, когда транзакция, которая их создала, успешно завершается (коммитится). Это помогает предотвратить накопление большого объема старых данных.

Answer 46

Относится к строкам данных, которые были удалены или обновлены, но все еще занимают место в таблице до тех пор, пока не будет выполнена команда VACUUM.

Answer 47

**VACUUM FULL** — это команда в PostgreSQL, которая выполняет полную очистку таблицы, освобождая неиспользуемое дисковое пространство и восстанавливая его операционной системе. В отличие от обычного VACUUM, который просто помечает "мертвые" строки (dead tuple) как доступные для перезаписи, VACUUM FULL перемещает все оставшиеся строки на новые страницы, эффективно сжимая таблицу. **Autovacuum** отвечает за удаление старых версий строк, помеченных как удаленные и обновление статистики о распределении данных в таблицах, что помогает планировщику запросов принимать более эффективные решения.

Answer 48

Суть атаки - введение в пользовательские данные, передаваемые через GET, POST или Cookie, произвольного SQL кода. Если ресурс уязвим, то можно с помощью такой атаки творить с пользовательской БД все что угодно **Возможные варианты инъекций:** 1. Сворачивание условий WHERE запросов к результату всегда TRUE\ 2. Присоединение к запросу результатов другого запроса с помощью оператора UNION **Защита:** 1. Использовать параметризованные запросы - не подставлять данные в запросы напрямую, а форматировать с помощью параметров. 2. Использовать хранимые процедуры - код процедуры хранится в БД, а не в коде приложения 3. Использовать whitelist для таблиц - ограничить список допустимых значений 4. Всегда валидировать пользовательский ввод 5. Системная учетка, от имени которой производятся действия на сервере должна иметь как можно меньше прав

Answer 49

- Оптимизация медленного запроса – это итеративный процесс, который в 2025 году строится вокруг анализа планов выполнения и структуры данных. Вот стандартный алгоритм: 1. Анализ плана выполнения (EXPLAIN ANALYZE). Запустите запрос с командой EXPLAIN (ANALYZE, BUFFERS): - **ANALYZE** – выполняет запрос и показывает реальное время, а не только догадки планировщика - **BUFFERS** – показывает работу с кэшем и диском 2. Индексация. Если вы видите Seq Scan в месте, где ожидается быстрый поиск: - B-tree индексы: создайте индексы для колонок в условиях WHERE, JOIN, ORDER BY, GROUP BY - Составные индексы: Если поиск идет по нескольким полям - Index-Only Scan: если в индексе есть все даные, нужные для запроса, PostgreSQL не будет обращаться к самой таблице 3. Переписывание запроса. Иногда проблема в самой структуре SQL: - Избегайте `SELECT *`: Запрашивайте только нужные колонки, чтобы уменьшить запрос передаваемых данных - Заменяйте подзапросы на JOIN: Коррелированные подзапросы часто медленнее, чем эффективный JOIN - Используйте EXISTS вместо IN: Для проверки наличия записей в других таблицах EXISTS часто работает быстрее - Фильтруйте рано: Накладывайте условиях WHERE как можно раньше, чтобы уменьшить объем данных для последующих соединений 4. Работа с данными и схемой - Партицирование: Если таблица огромная (миллионы строк), разбейте ее на части (например, по месяцам). Это позволит базе сканировать только нужный кусок - Обновление статистики: Выполните VACUUM ANALYZE, чтобы планировщик имел актуальные данные о распределении значений в таблице - Типы данных: Убедитесь, что типы колонок при сравнении совпадают, иначе индекс может не сработать

Answer 50

**PgBouncer** — это легковесный прокси-сервер для PostgreSQL, который реализует управление пулом подключений. Он используется для оптимизации работы с базой данных, особенно в сценариях с высоким числом подключений, что может быть трудно для PostgreSQL. **Зачем нужен PgBouncer** 1. **Снижение нагрузки на сервер**: Подключения к PostgreSQL требуют значительных ресурсов, включая память и CPU. PgBouncer снижает количество одновременных подключений, сохраняя их минимально необходимыми. 2. **Повышение производительности**: За счёт повторного использования подключений уменьшается время, затрачиваемое на установление новых соединений. 3. **Управление подключениями**: PgBouncer поддерживает различные режимы пуллинга подключений, оптимизируя работу для различных типов приложений.

Answer 51

– это высокопроизводительная система управления данными в оперативной памяти, которая часто используется как кэш, брокер сообщений или база данных.

Answer 52

**1. Хранение в памяти** - Все данные находятся в RAM - Обеспечивает сверхбыстрый доступ - Опционально может сохранять данные на диск для надежности **2. Структуры данных** Strings → Простые строки или числа Lists → Упорядоченные наборы строк Sets → Неупорядоченные наборы уникальных строк Hashes → Хеш-таблицы пар ключ-значение Sorted Sets → Упорядоченные множества с рейтингом **3. Атомарные операции** - Все операции выполняются последовательно - Нет риска повреждения данных при параллельном доступе - Поддержка транзакций

Answer 53

# Установка значения Работа со строками (Strings): **INCR key:** Увеличивает числовое значение ключа на 1. **DECR key: **Уменьшает числовое значение ключа на 1. **APPEND key value: **Добавляет значение к существующей строке. **STRLEN key:** Возвращает длину строки.

Answer 54

Работа с ключами (Key Management): **SET key value:** Устанавливает значение для ключа. **GET key:** Получает значение ключа. **DEL key [key ...]:** Удаляет один или несколько ключей. **EXISTS key:** Проверяет, существует ли ключ (возвращает 1 или 0). **KEYS pattern:** Поиск ключей по шаблону. **TYPE key: **Возвращает тип данных, хранящихся в ключе. **EXPIRE key seconds:** Устанавливает время жизни (TTL) для ключа в секундах. **TTL key:** Показывает оставшееся время жизни ключа. **FLUSHALL: **Удаляет все данные из текущей базы данных.

Answer 55

Работа с хешами (Hashes) — полезно для объектов: **HSET key field value: **Устанавливает поле в хеше. **HGET key field:** Получает значение поля в хеше. **HGETALL key:** Получает все поля и значения хеша.

Answer 56

Работа со списками (Lists): **LPUSH key value: **Добавляет элемент в начало списка. **RPUSH key value: **Добавляет элемент в конец списка. **LPOP key:** Удаляет и возвращает первый элемент списка. **LRANGE key start stop:** Получает диапазон элементов списка

Answer 57

Типичные сценарии использования Redis: - Кэширование данных - Управление сессиями - Очереди сообщений - Pub / Sub - Таблицы лидеров и счетчики - Геопространственные данные - Ограничение частоты запросов (Rate Limiting)

Answer 58

Redis хранит данные в памяти, что обеспечивает более быстрый доступ, но требует больше RAM и может терять данные при отключении питания (если не настроена персистентность).

Answer 59

Strings, Lists, Sets, Hashes, Sorted Sets Каждая структура имеет свои специфические команды и применения

Answer 60

TTL - это время жизни ключа. Используется для автоматической очистки устаревших данных (например, кэша или сессий)

Answer 61

```redis # Хорошо SET user:1234:session "abc123" Плохо SET u1234s "abc123" ```

Answer 62

`SET temp:data "value" EX 3600 # Удалится через час`

Answer 63

Транзакции в Redis (команды MULTI/EXEC) позволяют объединить группу команд в один атомарный блок, гарантируя последовательное выполнение без вмешательства других клиентов. Для сложных операций, требующих проверки данных, используйте WATCH для оптимистичной блокировки, что предотвращает конфликты и гарантирует целостность данных ```redis WATCH balance_user1 GET balance_user1 # (В приложении проверяем, что баланс > 100) MULTI DECRBY balance_user1 100 INCRBY balance_user2 100 EXEC ```

Лекция 2. SQL, Redis Flashcards

(88 cards)