Boolan网——C++微专业第十周学习笔记

(1)万用的hash function
在使用以Hash Table作为底层容器的容器(例如unordered_map)时,为了能够确定容器在Hash Table中的位置,就必须计算其Hash Code。对于自定义的容器类型而言,就必须自定义相对应的Hash Function。
<1>指定自定义的hash function的方法一:

#include<functional>
class Customer{
······
}

以上是一个自定义的类,将其作为HashTable的底层容器。利用Hash Function使系统清除怎样把这个类放置在Hash Table的一个具体的位置上。

class CustomerHash
{
public:
    std::size_t operator()(const Customer& c) const{
          return /*........*/;
    }
};

在上述类中,重载了()操作符,由此可以形成一个仿函数。

unordered_set<Customer, CustomerHash> customers;        // CustomerHash就是相对应的Hash Function

<2>指定自定义的hash function的方法二:

size_t customer_hash_func(const Customer& c)
{
return ······;
}
unorder_set<Customer, size(*) (const Cunstomer&)> customers(20, customer_hash_func);

这个方法实际是通过指定了一个函数指针的方式来通知容器,对于这个。自定义类到底应该使用哪个hash function.
<3>指定自定义的hash function的方法三:以struct hash 偏特化形式实现hash function。

class MyString
{
 private:
    char* _data;
    size_t _len;
};
    
namespace std;
{
   template<>
   struct hash<MyStrinng>
   {
        size_t operatoe()(const MyString& s) const noexcept
        {
           return hash<string>()(string(s.get()));
        }
   }
}

对于使用将Hash Code简单相加的方法是不合理的:

class CustomerHash
{
public:
      std::size_t operator()(const Customer& c) const{
            return std::hash<std::string>()(c.fname) 
                  + std::hash<std::string>()(c.Iname) 
                  + std::hash<long><c.no);
      }
}

虽然这个方法可以实现计算出Hash code,但是这样计算的hash code的重复概率比较高;而重复的hash code 会导致“bucket”中的元素过多,影响查询的效率。

一个万能的Hash Function:

class CustomerHash
{
public:
      std::size_t operator()(const Cunstomer& c) const {
            return hash_val(c.fname, c,Iname, c.no); 
      }
}

其详细代码:

#include<functional>
template<typename T>
inline void hash_combine(size_t& seed, const T& val){
         // 利用黄金分割比例
        seed = std::hash<T>(val) + 0x9e3779b9
              + (seed << 6) + (seed >> 2);
}

template<typename T>
inline void hash_val(size_t& seed, const T& val){
      hash_combine(seed, val);
}

template<typename T, typename... Types>
inline void hash_val(size_t& seed, const T& val, const Type&... args){
      hash_combine(seed, val);
      hash_val(seed, args...);
}

template<typename... Types>
inline size_t hash_val(const Types&... args){
      size_t seed = 0;
      hash_val(seed, args...);
      return seed;
}

在上述代码中使用了variadic templates,传入函数中的每个参数都会具备一个模版,也就是说,可能每个参数的类型都会不同,那么应该处理每个不同的参数需要一套对应的解决方案。上述代码就提供这样一种对于不同类型通用的解决方案。

template<typename... Types>
inline size_t hash_val(const Types&... args)

可以看作为是一个泛化的版本,因为这里面的模版可以传入任意数量的任意模版类型。

template<typename T, typename... Types>
inline void hash_val(size_t& seed, const T& val, const Type&... args)

接收的参数的范围是比第一个函数要少的,那么,也就是范围其实先对减小,我们可以把它理解为偏特化的一个过程,也就是在泛化中,调用了偏特化的函数,每次调用其实都会减少模版的数量。
针对于hash_val进行了三次重载,最后一个hash_val只接收一个模版,那么也就是最后的时候会被调用,也就是,通过函数重载和模版特化的过程来一层一层把模版参数的数量解开。最后调用hash_combine的函数来计算出hash code。
hash_combine函数中的处理方式保证了最后的计算结果足够Hash。
(2)tuple
tuple可以存放不同类型的数据。

#include <iostream>     // std::cout
#include <tuple>        // std::tuple, std::get, std::tie, std::ignore

int main()
{
    //通过构造函数来创建tuple对象
    std::tuple<int, char> foo(10, 'x');

    //通过make_tuple来创建tuple对象,并且可以实现自动类型推到
    //实际的类型应该为: tuple<string, double, int, char>
    auto bar = std::make_tuple("test", 3.1, 14, 'y');

    // 从tuple中获取数据
    std::get<2>(bar) = 100;                                    // access element

    int myint; char mychar;
    //通过tie函数来从tuple中一次性获取所有的数据
    std::tie(myint, mychar) = foo;                            // unpack elements

    //也可以通过std::ignore跳过部分不需要的元素,只取出需要的元素
    std::tie(std::ignore, std::ignore, myint, mychar) = bar;  // unpack (with ignore)

    mychar = std::get<3>(bar);

    //直接修改其中元素的值
    std::get<0>(foo) = std::get<2>(bar);
    std::get<1>(foo) = mychar;

    std::cout << "foo contains: ";
    std::cout << std::get<0>(foo) << ' ';
    std::cout << std::get<1>(foo) << '\n';

    typedef tuple<int, float, string> TupleType;
    //获取tuple中的元素个数
    cout << tuple_size<TupleType>::value << endl;  //3
    //获取元素类型
    tuple_element<1, TupleType>::type f1 = 1.0;  //float

    return 0;
}

tuple的实现原理(GNU4.8节选并简化版本):

//只有一个模版参数的版本的特化版本
        template<typename Values> class tuple;
        //没有模版参数的版本的特化版本
        template<> class tuple < > {};

        //每次都会继承剔除掉第一个模版参数的class
        template<typename Head, typename... Tail>
        class tuple<Head, Tail...> : private tuple < Tail... >
        {
            typedef tuple<Tail...> inherited;
            public:
                tuple();
                tuple(Head v, Tail... vtail) :m_head(v), inherited(vtail...){}

                typename Head::type head() { return m_head; }
            protected:
                Head m_head;
        };

为了能够处理每个不同类型的元素,tuple自动在多个参数之间构建了继承关系。每次继承的都是模版的后半部分,逐渐将第一个模版参数解析出来。在tuple中,head()可以返回第一个元素的值;tail()可以返回父类成分起点,返回类型是父类的类型。
(3)TypeTraits
GNU 2.9版本:

//泛化
template<class type>
struct __type_traits{
    typedef __true_type this_dummy_member_must_be_first;
    typedef __false_type has_trivial_default_constructor;
    typedef __false_type has_trivial_copy_constructor;
    typedef __false_type has_trivial_assignment_operator;
    typedef __false_type has_trivial_destructor;
    typedef __false_type is_POD_type;  //POD = Plain Old Data,代表旧式的class 也就是struct
};

//int的特化
template<>
struct __type_traits < int > {
    typedef __true_type has_trivial_default_constructor;
    typedef __true_type has_trivial_copy_constructor;
    typedef __true_type has_trivial_assignment_operator;
    typedef __true_type has_trivial_destructor;
    typedef __true_type is_POD_type;
}

//double的特化
template<>
struct __type_traits < double > {
    typedef __true_type has_trivial_default_constructor;
    typedef __true_type has_trivial_copy_constructor;
    typedef __true_type has_trivial_assignment_operator;
    typedef __true_type has_trivial_destructor;
    typedef __true_type is_POD_type;
}

在上述代码中,通过模板的泛化以及特化机制使得不同的类型进入不同的代码逻辑中。
利用typedef标志类型的特征:是否有默认的构造函数,拷贝构造,赋值构造,析构函数等。
对于自定义的类型,用户需要自己定义相对应的type traits。
从C++2.0 开始,type traits的复杂程度大幅上升。此时不需要再重新定义type traits。

{
    std::cout << "int: " << std::is_trivially_copy_constructible<int>::value << std::endl;
}

type_traits的实现:
<1>is_void

//去除const
template<typename _Tp>
struct remove_const{
    typedef _Tp type;
};
template<typename _Tp>
struct remove_const < _Tp const > {
    typedef _Tp type;
};
//volatile
template<typename _Tp>
struct remove_volotile{
    typedef _Tp type;
};
template<typename _Tp>
struct remove_volotile < _Tp volatile > {
    typedef _Tp type;
};
//去除const和volatile
template<typename _Tp>
struct remove_cv{
    typedef remove_const<typename remove_volatile<_Tp>::type>::type type;
};

template<typename>
struct __is_void_helper : public false_type{};

template<>
struct __is_void_helper<void> :public true_type{};

//is_void
template<typename _Tp>
struct is_void:public __is_void_helper<typename remove_cv<_Tp>::type>::type {}

<2>is_integral

typename<typename>
struct __is_integral_helper:public false_type{};

typename<>
struct __is_integral_helper<bool>:public true_type{};

typename<>
struct __is_integral_helper<char>:public true_type{};

typename<>
struct __is_integral_helper<signed char>:public true_type{};

typename<>
struct __is_integral_helper<unsigned char>:public true_type{};

template<>
struct __is_integral_helper<int>:public true_type{};

template<>
struct __is_integral_helper<unsigned int>:public true_type{};

template<>
struct __is_integral_helper<long>:public true_type{};

template<>
struct __is_integral_helper<unsigned long>:public true_type{};

template<>
struct __is_integral_helper<long long> :public true_type{};

template<>
struct __is_integral_helper<unsigned long long>:public true_type{};

//is_integral
template<typename _Tp>
struct __is_integral:public __is_integral_helper<typename remove_cv<_Tp>::type>::type{};

<3>is_class, is_union, is_enum, is_pod

//is_enum
template<typename _Tp>
struct is_enum:public integral_constant < bool, __is_enum(_Tp) > {};

//is_union
template<typename _Tp>
struct is_union:public integral_constant < bool, __is_union(_Tp) > {};

//is_class
template<typename _Tp>
struct is_class:public integral_constant < bool, __is_class(_Tp) > {};

//is_pod
//Could use is_standard_layout && is_trivial instead of the builtin.
template<typename _Tp>
struct is_pod:public integral_constant<bool, __is_pod(_Tp)>();

__is_xxx(_Tp)不存在与标准库中,应该是编译器的底层机制。
<4>is_move_assignable

template<typename _Tp, bool = __is_referenceable<_Tp>::value>
struct __is_move_assignable_impl;

template<typename _Tp>
struct __is_move_assignable_impl<_Tp, false> :public false_type{};

template<typename _Tp>
struct __is_move_assignable_impl<_Tp, true> :public is_assignable < _Tp&, _Tp&& > {};

template<typename _Tp>
struct __is_referenceable :public __or_<is_object<_Tp>, is_reference<_Tp>>::type

template<typename _Res, typename... _Args>
struct __is_referenceable<_Res(_Args...)> :public true_type{};

template<typename _Res, typename... _Args>
struct __is_referenceable<_Res(_Args......)> :public true_type{};

//is_move_assignable
template<typename _Tp>
struct is_move_assignable :public __is_move_assignable_impl < _Tp > {};

(4)cout

class ostream : virual public ios
{
public:
    ostream& operator << (char c);
    ostream& operator << (unsigned char c){ return (*this) << (char)c; };
    ostream& operator << (signed char c){ return (*this) << (char)c; };
    //cout根据操作符重载的方式来使得cout可以接受许多的类型
};

class _IO_ostream_withassign : public ostream
{
public:
    _IO_ostream_withassign& operator= (ostream&);
    _IO_ostream_withassign& operator=(_IO_ostream_withassign& rhs){
        return oprator = (static_cast<ostream&> (rhs);
    }
}

extern _IO_ostream_withassign cout;

(5)moveable元素对于容器影响
<1>对vector的影响


在进行数据插入是,vector会进行多次容积增长,其中要调用copy Constructer或move Constructer。有move Constructer的结果会更快。
<2>对list的影响


在list的数据插入过程中不存在过多的数据搬移,所以有没有move Constructer对效率差别不大。
同样对于deque、multiset、ubordered_multiset的效率影响也不大。

定义一个moveable class:

class MyString{
public:
    static size_t DCtor;    //累计调用默认ctor的次数
    static size_t Ctor;     //累计ctor的调用次数
    static size_t CCtor;    //累计copy-ctor的调用次数
    static size_t CAsgn;  //累计copy-asgn的调用次数
    static size_t MCtor;  //累计move-ctor的调用次数
    static size_t MAsgn;  //累计move-asgn的调用次数
    static size_t Dtor; //累计dtor的调用次数

private:
    char* _data;
    size_t _len;
    void _init_data(const char* s){
        _data = new char[_len + 1];
         memcpy(_data, s, _len);
        _data[_len] = '0';
    }
public:
    //default ctor;
    MyString() :_data(NULL), _len(0){ ++DCtor; }
    //ctor
    MyString(const char* p) : _len(strlen(p)){
        ++Ctor;
        _init_data(p);
    }

    //copy ctor
    MyString(const  MyString& str) : _len(str._len){
        ++CCtor;
        _init_data(str._data);
    }

    //move ctor, with noexcept
    MyString(MyString&& str) noexcept : _data(str._data), _len(str._len){
        ++MCtor;
        str._len = 0;
        str._data = NULL;  //避免delete(in dtor)
    }

    //cope assignment 
    MyString& operator= (const MyString& str){
        ++CAsgn;
        if (this != &str){
            if (_data) delete _data;
            _len = str._len;
            _init_data(str._data);
        }
        return *this;
    }

    //move assignment
    MyString& operator=(MyString&& str) noexcept{
        ++MAsgn;
        if (this != &str){
            if (_data) delete _data;
            _len = str._len;
            _data = str._data;  //move
            str._len = 0;
            str._data = NULL;
        }
        return *this;
    }

    //dtor
    virtual ~MyString(){
        ++Dtor;
        if (_data) delete _data;
    }

    bool operator< (const MyString& rhs) const{
        return std::string(this->_data) < std::string(rhs._data);
    }

    bool operator==(const MyString& rhs) const{
        return std::string(this->_data) == std::string(rhs._data);
    }
    char* get() const { return _data; }

};

size_t MyString::DCtor = 0;
size_t MyString::Ctor = 0;
size_t MyString::CCtor = 0;
size_t MyString::CAsgn = 0;
size_t MyString::MCtor = 0;
size_t MyString::MAsgn = 0;
size_t MyString::Dtor = 0;

namespace std{
    template<>
    struct hash < MyString > {
        size_t operator()(const MyString& s)const noexcept{ return hash<string>()(string(s.get())); }
    }
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容