이전 TBB 의 lock free 컨테이너들에 대한 동시성 테스트를 진행하면서 멀티 스레드에 최적화된 메모리 할당자를 사용하지 않을까하는 맘에 검색을 해봤더니 역시나 있더군요. (http://rein.kr/blog/archives/1817)

사용법도 간단하고 효과도 좋은거 같습니다. 실시간 메모리 할당을 얼마나 할지는 몰라도 적용하기도 쉬운데 굳이 사용하지 않을 이유는 없을거 같네요.

간단하게 사용법은

   1: #include <tbb/tbbmalloc_proxy.h>

헤더를 추가하고 tbb 관련 dll 들만 추가시켜 주면 malloc / free, new / delete 가 tbb 관련 함수들로 치환이 됩니다.

사용하지 않으려면 단순 헤더파일만 제거해 주시면 됩니다.

코어 4개인 PC 에서 스레드 4, 10개로 테스트 해봤는데 두배 정도의 차이가 났습니다.