Я вставил приблизительно 15 миллионов рядов и 32 колонки в hbase столе через MapReduce.
# Key-valued data e.g.
company= ibm ! employee= sw ...
# In hbase it's look like
row =1 column = f1: company time stamp=1123344456 value =ibm ....
И в то время как я запустил вопрос
(scan 'sample_names', {COLUMNS=>"f1:company", FILTER=>SingleColumnValueFilter.new(Bytes.toBytes('f1'), Bytes.toBytes('company'), CompareFilter::CompareOp.valueOf('EQUAL'), SubstringComparator.new("ibm")) })
потребовались о 360.09 секунды, чтобы принести данные. там способ улучшить исполнение этого вопроса? мы можем уменьшить это время выполнения запроса вторичной индексацией? Если да, пожалуйста, предложите, как добавить индексацию для конкретного определителя колонки.