В повседневной работе приходится сталкиваться с довольно однотипными ошибками при написании запросов.
В этой статье хотелось бы привести примеры того, как НЕ надо писать запросы.
- Выборка всех полей
1SELECT * FROM table
При написании запросов не используйте выборку всех полей — «*». Перечислите только те поля, которые вам действительно нужны. Это сократит количество выбираемых и пересылаемых данных. Кроме этого, не забывайте про покрывающие индексы. Даже если вам на самом деле необходимы все поля в таблице, лучше их перечислить. Во-первых, это повышает читабельность кода. При использовании звездочки невозможно узнать какие поля есть в таблице без заглядывания в нее. Во-вторых, со временем количество столбцов в вашей таблице может изменяться, и если сегодня это пять INT столбцов, то через месяц могут добавиться TEXT и BLOB поля, которые будут замедлять выборку. - Запросы в цикле.Нужно четко представлять себе, что SQL — язык, оперирующий множествами. Порой программистам, привыкшим думать терминами процедурных языков, трудно перестроить мышление на язык множеств. Это можно сделать довольно просто, взяв на вооружение простое правило — «никогда не выполнять запросы в цикле». Примеры того, как это можно сделать:
1. Выборки
123$news_ids = get_list('SELECT news_id FROM today_news ');while($news_id = get_next($news_ids))$news[] = get_row('SELECT title, body FROM news WHERE news_id = '. $news_id);
Правило очень простое — чем меньше запросов, тем лучше (хотя из этого, как и из любого правила, есть исключения). Не забывайте про конструкцию IN(). Приведенный код можно написать одним запросом:
1SELECT title, body FROM today_news INNER JOIN news USING(news_id)
2. Вставки
123$log = parse_log();while($record = next($log))query('INSERT INTO logs SET value = '. $log['value']);
Гораздо более эффективно склеить и выполнить один запрос:
1INSERT INTO logs (value) VALUES (...), (...)
3. ОбновленияИногда бывает нужно обновить несколько строк в одной таблице. Если обновляемое значение одинаковое, то все просто:
1UPDATE news SET title='test' WHERE id IN (1, 2, 3)Если изменяемое значение для каждой записи разное, то это можно сделать таким запросом:
12345UPDATE news SETtitle = CASEWHEN news_id = 1 THEN 'aa'WHEN news_id = 2 THEN 'bb' ENDWHERE news_id IN (1, 2)Тесты показывают, что такой запрос выполняется в 2-3 раза быстрее, чем несколько отдельных запросов.
- Выполнение операций над проиндексированными полями
1SELECT user_id FROM users WHERE blogs_count * 2 = $value
В таком запросе индекс использоваться не будет, даже если столбец blogs_count проиндексирован. Для того, чтобы индекс использовался, над проиндексированным полем в запросе не должно выполняться преобразований. Для подобных запросов выносите функции преобразования в другую часть:
1SELECT user_id FROM users WHERE blogs_count = $value / 2;Аналогичный пример:
1SELECT user_id FROM users WHERE TO_DAYS(CURRENT_DATE) — TO_DAYS(registered) <= 10;не будет использовать индекс по полю registered, тогда как
1SELECT user_id FROM users WHERE registered >= DATE_SUB(CURRENT_DATE, INTERVAL 10 DAY);будет.
- Выборка строк только для подсчета их количества
12$result = mysql_query(«SELECT * FROM table», $link);$num_rows = mysql_num_rows($result);
Если вам нужно выбрать количество строк, удовлетворяющих определенному условию, используйте запрос SELECT COUNT(*) FROM table, а не выбирайте все строки лишь для того, чтобы подсчитать их количество.
- Выборка лишних строк
1234$result = mysql_query(«SELECT * FROM table1», $link);while($row = mysql_fetch_assoc( $result) && $i < 20) {…}
Если вам нужны только n строк выборки, используйте LIMIT, вместо того, чтобы отбрасывать лишние строки в приложении.
- Использование ORDER BY RAND()
1SELECT * FROM table ORDER BY RAND() LIMIT 1;
Если в таблице больше, чем 4-5 тысяч строк, то ORDER BY RAND() будет работать очень медленно. Гораздо более эффективно будет выполнить два запроса:
Если в таблице auto_increment’ный первичный ключ и нет пропусков:
12$rnd = rand(1, query('SELECT MAX(id) FROM table'));$row = query('SELECT * FROM table WHERE id = '.$rnd);
либо:
12$cnt = query('SELECT COUNT(*) FROM table');$row = query('SELECT * FROM table LIMIT '.$cnt.', 1');
что, однако, так же может быть медленным при очень большом количестве строк в таблице. - Использование большого количества JOIN’ов
1234567891011121314SELECTv.video_ida.name,g.genreFROMvideos AS vLEFT JOINlink_actors_videos AS la ON la.video_id = v.video_idLEFT JOINactors AS a ON a.actor_id = la.actor_idLEFT JOINlink_genre_video AS lg ON lg.video_id = v.video_idLEFT JOINgenres AS g ON g.genre_id = lg.genre_id
Нужно помнить, что при связи таблиц один-ко многим количество строк в выборке будет расти при каждом очередном JOIN’е. Для подобных случаев более быстрым бывает разбить подобный запрос на несколько простых. - Использование LIMITSELECT… FROM table LIMIT $start, $per_pageМногие думают, что подобный запрос вернет $per_page записей (обычно 10-20) и поэтому сработает быстро. Он и сработает быстро для нескольких первых страниц. Но если количество записей велико, и нужно выполнить запрос SELECT… FROM table LIMIT 1000000, 1000020, то для выполнения такого запроса MySQL сначала выберет 1000020 записей, отбросит первый миллион и вернет 20. Это может быть совсем не быстро. Тривиальных путей решения проблемы нет. Многие просто ограничивают количество доступных страниц разумным числом. Также можно ускорить подобные запросы использованием покрывающих индексов или сторонних решений (например sphinx).
- Неиспользование ON DUPLICATE KEY UPDATE
12345$row = query('SELECT * FROM table WHERE id=1');if($row)query('UPDATE table SET column = column + 1 WHERE id=1')elsequery('INSERT INTO table SET column = 1, id=1');
Подобную конструкцию можно заменить одним запросом, при условии наличия первичного или уникального ключа по полю id:
1INSERT INTO table SET column = 1, id=1 ON DUPLICATE KEY UPDATE column = column + 1