在使用一些复杂数据结构时,往往需要使用自定义的比较函数。
比方说,我一个vector里面,存储的数据结构为std::tuple<int, std::set<string>>,先不要说怎么会有这么复杂的设计,总之,现在需要对这个vector进行排序,调用标准库std::sort(#0, #0, #1),排序的准则是按照tuple里面std::set<string>的长度。
既然不能使用标准、默认的比较函数,如std::less<int>, std::greater<int>,那只能自己定义比较函数。
自定义比较函数,常用如下几种方法:
方法一, 定义比较函数
方法二, function object,也有人称之为仿函数
方法三, 重载<操作符
方法四, lamda表达式
下面参照代码分别加以说明。
1. 定义比较函数
这个函数往往放在全局,至少能被std::sort的时候访问到。
如:
这种方法,也可以称之为函数指针,这个熟知C语言的都很熟悉吧,但是按照最近几年工作在C++11/14/17的经验,似乎函数指针不怎么大量使用了,原因是这个太C语言风格了吧,加上有了lambda这样的好工具,所以,使用频率少了。
那么上面的函数,在调用的时候,代码如下:
std::sort(helper.begin(), helper.end(), cmpfunction);
2. 函数对象,function object
有人称之为仿函数,大概就是一个object,可以被()调用吧,因为它重载了()操作符。
这个类型,可以用struct,也可以用class。
看下面两个struct定义。
第一种呢,调用的时候需要写成这样:
std::sort(helper.begin(), helper.end(), cmp());
第二种,调用时写成这样:
std::sort(helper.begin(), helper.end(), cmp_struct);
有没有小伙伴疑惑,为什么第二个cmp_struct不需要加 () 来初始化?
我是疑惑了一阵子。
早已忘记当时学struct的时候,具体语法规范,只是形成自己的习惯,一直这样定义和使用一个struct如下,
struct MyStruct
{
int age;
string name;
};
MyStruct var;
写到这里,就可以正常定义MyStruct类型的变量,var变量也可以赋值和访问了。
久而久之,都忘记了这个MyStruct写在struct后面和写在最后整个结构体的 } 后面的区别了。
按照语法定义
struct attr-spec-seq(optional) name(optional) { struct-declaration-list },
这里的name是类型名称,是type,name这里是可选的,如果省略name,那么必须紧挨在{ struct-declaration-list }之后定义你要使用的变量名称,过了这里,就没法在定义同样结构的struct了,因为都没给它一个类型名字,后面无法点名使用了。
具体解释为,struct attr-spec-seq(optional) { struct-declaration-list } var1,var2;这里定义了变量var1和var2,后续可以并且只可以按照这样的机构使用var和var2了。
再说会std::sort(#0, #0, #1)的第三个参数,compare定义,这里需要传入一个object,所以,可以直接传入var1和var2这样的变量,但是要是提供一个类型名,就是构造这个类型的object才可以。
选用class定义道理一样的,同样重载 () 操作符,调用sort的是hi和传入cmp_class()。
调用时使用下面代码:
std::sort(helper.begin(), helper.end(), cmp_class());
3. 重载<操作符
这个的使用,就不再是类型和比较分开了,而是设计一个包含需要数据的class,然后这个class重载 < 操作符,好处是std::sort()只需要传入2个参数,不需要传入自己的Compare,缺点就是,这个class只能有一种比较方法,就好像这个物品,就是红色,你无法在一些具体的场景下,让它变成其他颜色。
本例中,将std::tuple<int, std::set<string>>封装成一个class,同时重载其 < 操作符,注意不是 > 符号,因为std::sort默认的会去调用 < 比较操作。下面是不定义 < 操作符号时的编译出错提示。
\mingw\lib\gcc\mingw32\6.3.0\include\c++\bits\predefined_ops.h:55:22: note: 'tuple_type' is not derived from 'const __gnu_cxx::__normal_iterator<_Iterator, _Container>'
{ return *__it < __val; }
class的实现如下:
使用的时候,这样,设计到tuple_type的排序,如果不指明其他的比较规则,就默认tuple_type类内部的 < 操作符。
std::vector<tuple_type> container;
tuple_type data1{2, std::set<std::string>{"google", "facebook"}};
container.push_back(data1);
tuple_type data2{3, std::set<std::string>{"google"}};
container.push_back(data2);
std::sort(container.begin(), container.end());
4. lambda表达式
lambda表达式是一个很好用的东西啊,这里也不例外,实现如下:
std::sort(helper.begin(), helper.end(), [](std::tuple<int, std::set<string>>& a, std::tuple<int, std::set<string>>& b){
return std::get<1>(a).size() > std::get<1>(b).size();
});
好了,常用的就这些方法了,自己选择一个自己习惯的方法。
附上完整的代码。
bool cmpfunction(const std::tuple<int, std::set<string>>& a, const std::tuple<int, std::set<string>>& b)
{
return std::get<1>(a).size() > std::get<1>(b).size();
};
struct cmp
{
bool operator()(const std::tuple<int, std::set<string>>& a, const std::tuple<int, std::set<string>>& b)
{
return std::get<1>(a).size() < std::get<1>(b).size();
}
};
struct
{
bool operator()(const std::tuple<int, std::set<string>>& a, const std::tuple<int, std::set<string>>& b)
{
return std::get<1>(a).size() > std::get<1>(b).size();
}
} cmp_struct;
class cmp_class
{
public:
bool operator()(const std::tuple<int, std::set<string>>& a, const std::tuple<int, std::set<string>>& b)
{
return std::get<1>(a).size() < std::get<1>(b).size();
}
};
class tuple_type
{
private:
int value;
std::set<std::string> data;
public:
tuple_type(int v, std::set<std::string> container): value(v), data(std::move(container)){};
int getLen()
{
return data.size();
}
bool operator<(tuple_type& b)
{
return data.size() < b.getLen();
}
/*
bool operator>(tuple_type& b)
{
return data.size() > b.getLen();
}
*/
void show()
{
cout<<value<<" ";
}
};
void helperPrint(std::string info, std::vector<std::tuple<int, std::set<string>>>& helper)
{
cout<<info<<": ";
for(auto i = 0; i < helper.size(); i++)
cout<<std::get<0>(helper[i])<<" ";
cout<<std::endl;
}int main() {
std::vector<std::tuple<int, std::set<string>>> helper;
auto one = std::make_tuple<int, std::set<string>>(1, std::set<string>{"google", "facebook"});
helper.push_back(one);
auto two = std::make_tuple<int, std::set<string>>(0, std::set<string>{"google"});
helper.push_back(two);
std::sort(helper.begin(), helper.end(), cmpfunction);
helperPrint("function", helper);
std::sort(helper.begin(), helper.end(), cmp());
helperPrint("struct type", helper);
std::sort(helper.begin(), helper.end(), cmp_struct);
helperPrint("struct variable", helper);
std::sort(helper.begin(), helper.end(), cmp_class());
helperPrint("class", helper);
std::sort(helper.begin(), helper.end(), [](std::tuple<int, std::set<string>>& a, std::tuple<int, std::set<string>>& b){
return std::get<1>(a).size() > std::get<1>(b).size();
});
helperPrint("lambda", helper);
std::vector<tuple_type> container;
tuple_type data1{2, std::set<std::string>{"google", "facebook"}};
container.push_back(data1);
tuple_type data2{3, std::set<std::string>{"google"}};
container.push_back(data2);
std::sort(container.begin(), container.end());
for(auto item : container)
{
item.show();
}
cout<<endl;
return 0;
}
以上内容,均在编译器运行通过,当然随着平台不同,可能会存在不兼容,以上内容仅供参考。