ПроектыКопипаст рулит! В PHP.

Предыстория. Заметили, что в одном из наших проектов один из модулей выполняется довольно долго. Суть модуля — получить данные из базы, очистить их и отдать клиенту. Запустили профайлер, держа в голове, что тормозит либо запрос, либо очистка данных. Результат немного удивил (цифры отражают только порядок):

Время всего модуля: 0,68 сек
Время получения данных из базы: 0,02 сек
Время очистки данных: 0,34 сек

Копипаст рулит! В PHP. →

Проекты2015

Очень давно не писал в блог… Если честно — не о чем было писать. Последний год работаю над системой распознавания адресов (аналог dadata.ru). Не все так просто, как казалось на первый взгляд. Но это только добавляет азарта. Проблема в том, что основные проекты как-раз доросли до момента, когда такая система жизненно необходима, а она еще не готова…

Ладно, это так, отступление. Сам пост о планах на 2015-й год. Еще ни разу я не публиковал в блоге ни результаты прошлого года, ни планы текущего. В данном случае — исключение + повод для мотивации.
2015 →

Заметки, ПроектыПростая SQL-задача

Время от времени приходится решать не тривиальные задачи. Одна из последних: получить даты, когда были какие-либо записи. В день может быть 84600 записей на пользователя (по количеству секунд), соответственно в месяц около 2 600 000 на пользователя. Пользователей — не ограничено (тестировалось на базе в пару сотен пользователей). Индексы проставлены.

Казалось-бы, все элементарно и просто:

SELECT
	DATE_FORMAT(`date`, '%Y-%m-%d') as `fdate`
FROM
	`user_coord`
WHERE
	`user` = '4' AND
	`date` > '2013-09' AND
	`date` < '2013-10'
GROUP BY
	`fdate`

Но, мы же помним, что GROUP BY = зло? Да и время выполнения запроса, 1.5 — 2 секунды, совсем не устраивает. Включаем мозг…
Простая SQL-задача →

Заметки, ПроектыMD5 и скорость выборки

Пару дней назад завязался небольшой диалог в твиттере по поводу шифрования паролей в веб-сервисах. На фразу «кто не использует — идиот» мне ответили в стиле:

Шифрование создает сильную дополнительную нагрузку для веб-сервиса и большие проекты избегают подобного.

Подобное я слышу уже в сотый раз, поэтому решил сделать маленький тест и показать, что это абсолютно не верно и создатели этих сервисов (в которых важные данные, такие как пароли, номера карт и пр., не шифруются) полные идиоты.

Собственно, сам тест очень простой. Я создал таблицу, в которой 3 поля:

  1. id — привычка;
  2. str — данные в открытом виде (в тесте совпадает с id);
  3. pass — хешированные данные (md5(id)).

Таблицу заполнил 10000-ми строками. Теперь сами тесты:

mysql_connect('openserver', 'root', NULL) or die('err connect');
mysql_select_db('md5') or die('err select db');

$start = microtime(TRUE);
for($i=1;$i<=10000;$i++)
{
mysql_query('SELECT FROM `str` WHERE `str`="'.$i.'" LIMIT 1');
//    mysql_query('SELECT FROM `str` WHERE `pass`=MD5("'.$i.'") LIMIT 1');
//    mysql_query('SELECT FROM `str` WHERE `pass`="'.md5($i).'" LIMIT 1');
}

echo microtime(TRUE) - $start;

Из кода видно, что я проверяю 3 типа запросов:

  1. запрос по не хешированной строке;
  2. запрос по md5, хеширование внутри mysql;
  3. запрос по md5, хеширование в php.

MD5 и скорость выборки →

Заметки, ПроектыЛенивые программисты

В последние несколько дней изучаю движки инет-магазинов, хочу сделать для супруги инет-магазин. В процессе изучения натыкаюсь на много интересных вещей, о которых расскажу как-нибудь потом. А сегодня меня ОЧЕНЬ СИЛЬНО удивил движок инет-магазина, стоимостью почти 400$. Вдумайтесь — в некоторых местах нашей родины столько получают за месяц работы! Ну, думаю, раз такая стоимость — продукт должен быть отличный…
Ленивые программисты →